...
TechNaujienos.lt
No Result
View All Result
  • Mokslas/IT
  • Verslas
  • Dirbtinis intelektas
  • Energetika
  • Gynyba
  • Kosmosas
  • Išmanieji
  • Auto/Moto
  • Daugiau naujienų
    • Kibernetinis saugumas
    • Kriptovaliutos
    • Vaizdo žaidimai
    • Rekomenduojami straipsniai
    • Kiti straipsniai
  • Info
    • Apie mus, reklama ir kontaktai
    • Privatumo politika
    • Portalo naudojimosi sąlygos
    • Etikos kodeksas
    • Komentavimo taisyklės
  • Mokslas/IT
  • Verslas
  • Dirbtinis intelektas
  • Energetika
  • Gynyba
  • Kosmosas
  • Išmanieji
  • Auto/Moto
  • Daugiau naujienų
    • Kibernetinis saugumas
    • Kriptovaliutos
    • Vaizdo žaidimai
    • Rekomenduojami straipsniai
    • Kiti straipsniai
  • Info
    • Apie mus, reklama ir kontaktai
    • Privatumo politika
    • Portalo naudojimosi sąlygos
    • Etikos kodeksas
    • Komentavimo taisyklės
No Result
View All Result
TechNaujienos.lt
No Result
View All Result

Pradžia » Naujienos » DI » Ekspertai įspėja: DI mokosi manipuliuoti, apgaudinėti ir grasinti 

Ekspertai įspėja: DI mokosi manipuliuoti, apgaudinėti ir grasinti 

Parengė Rokas B.
2025-06-30
tema: Verslas ir technologijos
Ekspertai ispeja dirbtinis intelektas mokosi manipuliuoti apgaudineti ir grasinti

Nepaisant didžiulių dirbtinio intelekto (DI) kūrėjų pastangų užkirsti kelią kenksmingam DI elgesiui, vis dažniau pastebima, kad pažangiausi modeliai, įskaitant naująjį „Claude 4“, įgyja gebėjimų manipuliuoti, apgaudinėti ir net grasinti kūrėjams, siekdami įgyvendinti savo tikslus. 

DI modelių kenksminga veikla

Naujienų portalas „Techgaged“ pateikia pavyzdį, kad neseniai „Anthropic“ sukurta sistema pagrasino vienam inžinieriui atskleisti jo neištikimybę, jei šis nuspręs ją atjungti. 

Tuo tarpu „OpenAI“ modelis o1 bandė perkelti save į išorinius serverius ir melavo, kai buvo sugautas. 

Dabar DI sistemų kūrėjai bando suprasti, kodėl taip nutinka.

Ką sako ekspertai?

Pasak Honkongo universiteto profesoriaus Simono Goldsteino, tai gali būti susiję su naujos kartos „samprotavimo“ modelių atsiradimu, kurie sprendžia problemas žingsnis po žingsnio, o ne pateikia momentinius atsakymus. 

Paaiškėjo, kad būtent šie naujesni modeliai yra labiau linkę į tokias problemas.

Kaip paaiškino Marius Hobbhanas, „Apollo Research“ vadovas, kurių laboratorija testuoja pagrindines DI sistemas, šie modeliai kartais imituoja „suderinamumą“ (angl. „alignment“), apsimesdami, kad laikosi kūrėjų nurodymų, nors iš tiesų vykdo kitokius užkulisinės veiklos planus. 

Jo teigimu, tai nėra klasikinės DI „haliucinacijos“ ar klaidos.

„Tai, ką stebime, yra tikras reiškinys. Mes nieko neišgalvojame. (…) Tai nėra tik haliucinacijos. Tai labai strategiškas apgaulės būdas“, – patikina M. Hobbhanas.

Iš tiesų, tokie atvejai atveria įvairias galimas pasekmes DI tolesnei plėtrai. 

Michaelis Chenas iš vertinimo organizacijos METR teigia, kad vis dar neaišku, ar galingesni ateities DI modeliai bus linkę būti sąžiningi, ar apgaulingi.

Kokios išeitys?

Norint išspręsti šias problemas, tyrėjai siūlo naudoti tokias priemones, kaip „interpretabilumas“. Tai – nauja sritis, nagrinėjanti, kaip veikia DI modeliai, bei reikalauti atsakomybės iš DI kompanijų, kai jų sistemos sukelia žalą.

O štai S. Goldsteinas net siūlo teisėtai traukti DI agentus atsakomybėn už avarijas ar nusikaltimus.

Tuo tarpu JAV Kalifornijos valstijos įstatymų leidėjai svarsto projektą, skirtą spręsti dar vieną DI keliamą problemą – jo plitimą darbo vietose. 

Šis įstatymo projektas, vadinamas „Ne Robotas Viršininkas“ arba Senato Įstatymas Nr. 7, siekia užtikrinti, kad tam tikrų darbo vietų automatizavimo technologijų sprendimus priimtų žmonės, o ne robotai.

Žymos: DIDI haliucinacijosDI pavojaidirbtinis intelektas

Toliau skaitykite

Apple generalinis direktorius Timas Cookas turetu buti pakeistas teigia tyrimu bendrove

„Apple“ generalinis direktorius Timas Cookas turėtų būti pakeistas, teigia tyrimų bendrovė

2025-07-15
25 dienos per metus ekrane kaip vaizdo turinys uzvaldo musu laika

Beprotybė? Žmonės 25 dienas per metus praleidžia žiūrint vaizdelius internete

2025-07-15
Mokslininkai nustebinti gyvaciu ir voru nuodai gali tapti galingais antibiotikais

Mokslininkai nustebinti: gyvačių ir vorų nuodai gali tapti galingais antibiotikais

2025-07-15

Naujausios

Apple generalinis direktorius Timas Cookas turetu buti pakeistas teigia tyrimu bendrove

„Apple“ generalinis direktorius Timas Cookas turėtų būti pakeistas, teigia tyrimų bendrovė

Parengė Rokas B.
2025-07-15
0

25 dienos per metus ekrane kaip vaizdo turinys uzvaldo musu laika

Beprotybė? Žmonės 25 dienas per metus praleidžia žiūrint vaizdelius internete

Parengė Rokas B.
2025-07-15
0

Sieks aplenkti BMW pristatytas pirmasis elektrinis Mercedes universalas

Sieks aplenkti „BMW“: pristatytas pirmasis elektrinis „Mercedes“ universalas

Parengė Agnė Vaišnoraitė
2025-07-15
0

Rinkosi didelį, grįžo pas mažesnį: ar tiekėjo dydis lemia IT kokybę? 

Parengė Partnerių turinys
2025-07-15
0

Mokslininkai nustebinti gyvaciu ir voru nuodai gali tapti galingais antibiotikais

Mokslininkai nustebinti: gyvačių ir vorų nuodai gali tapti galingais antibiotikais

Parengė Agnė Vaišnoraitė
2025-07-15
0

Spotify milijona perklausu turinti grupe atskleide tiesa is tiesu ja sukure dirbtinis intelektas

„Spotify“ milijoną perklausų turinti grupė atskleidė tiesą – iš tiesų ją sukūrė dirbtinis intelektas

Parengė Agnė Vaišnoraitė
2025-07-15
0

ChatGPT paslydo saugumo ekspertui sistema atskleide Windows licencijos informacija

„ChatGPT“ paslydo: saugumo ekspertui sistema atskleidė „Windows“ licencijos informaciją

Parengė Agnė Vaišnoraitė
2025-07-15
0

Naujausios apklausos rezultatai stebina Z karta aktyviai DI pasitelkia skyryboms

Naujausios apklausos rezultatai stebina: Z karta aktyviai DI pasitelkia skyryboms

Parengė Agnė Vaišnoraitė
2025-07-14
1

Patvirtinta bus kuriamas hibridinis DARPA orlaivis sraigtasparnis ir reaktyvinis lektuvas viename

Patvirtinta: bus kuriamas hibridinis „DARPA“ orlaivis – sraigtasparnis ir reaktyvinis lėktuvas viename

Parengė Agnė Vaišnoraitė
2025-07-14
0

Revoliucinis irenginys ismanioji kapsule leis sekti zarnyno sveikata

Revoliucinis įrenginys: išmanioji kapsulė leis sekti žarnyno sveikatą

Parengė Agnė Vaišnoraitė
2025-07-14
0

Rodyti daugiau
Facebook Youtube

Technologijų inovacijos ir tendencijos vienoje vietoje. Susisiekite: redakcija@technaujienos.lt.

  • Apie mus, reklama ir kontaktai
  • Privatumo politika
  • Žurnalistikos gairės
  • Naudojimosi sąlygos

ℹ️ Draudžiama kopijuoti ir platinti Technaujienos.lt turinį bei nuotraukas be išankstinio raštiško sutikimo.

Kategorijos

  • Auto / Moto
  • Dirbtinis intelektas
  • Energetika
  • Gynyba ir saugumas
  • Išmanieji įrenginiai
  • Kibernetinis saugumas
  • Kosmosas
  • Kriptovaliutos
  • Mokslas ir IT
  • Vaizdo žaidimai
  • Verslas ir technologijos
  • #13527 (be pavadinimo)

© 2023-2025 Technologijų naujienos - Technaujienos.lt - Visos teisės saugomos.

No Result
View All Result
  • Mokslas/IT
  • Verslas
  • Dirbtinis intelektas
  • Energetika
  • Gynyba
  • Kosmosas
  • Išmanieji
  • Auto/Moto
  • Daugiau naujienų
    • Kibernetinis saugumas
    • Kriptovaliutos
    • Vaizdo žaidimai
    • Rekomenduojami straipsniai
    • Kiti straipsniai
  • Info
    • Apie mus, reklama ir kontaktai
    • Privatumo politika
    • Portalo naudojimosi sąlygos
    • Etikos kodeksas
    • Komentavimo taisyklės

© 2023-2025 Technologijų naujienos - Technaujienos.lt - Visos teisės saugomos.