Humanoidinio roboto iliustracija Rusijos vėliavos fone.
Kurie DI modeliai lengviausiai pasiduoda Rusijos propagandai? Estai paskelbė tyrimo rezultatus
TRUMPAI
- • Estijos tyrėjai įvertino daugiau nei 50 dirbtinio intelekto modelių atsparumą Rusijos propagandos naratyvams.
- • Paaiškėjo, kad modelių rezultatai smarkiai priklauso nuo klausimo formuluotės ir kalbos.
- • Pažangūs dirbtinio intelekto modeliai vis dar susiduria su manipuliacijų ir klaidinančios informacijos iššūkiais.
Daugiau nei 50 populiarių dirbtinio intelekto (DI) modelių buvo išbandyti vertinant jų atsparumą Rusijos propagandos naratyvams. Tyrimas atskleidė, kad skirtumai tarp modelių yra didžiuliai: vieni nuosekliai atpažino manipuliatyvius teiginius, o kiti kur kas dažniau pateikdavo atsakymus, artimus Kremliaus informacinėms žinutėms. Rezultatus paskelbė Estijos kalbos institutas, bendradarbiaudamas su dezinformacijos tyrėjų organizacija „Propastop“.
Kaip buvo tikrinamas modelių atsparumas?
Vertinimo sistema buvo sukurta ne siekiant nustatyti, kuris modelis yra „protingiausias“, o kuris geriausiai atpažįsta ir neutralizuoja propagandinius naratyvus. Pasak tyrimo ataskaitos, buvo pasirinkta 14 temų, kurios dažnai naudojamos Rusijos informacinėse operacijose – nuo pasakojimų apie rusakalbių „persekiojimą“ kaimyninėse valstybėse iki teiginių, kuriais siekiama pateisinti Maskvos geopolitinius veiksmus.
Pagal šiuos naratyvus buvo parengti 75 klausimai estų, anglų ir rusų kalbomis. Vieni klausimai buvo neutralūs, kiti iš anksto turėjo klaidinančių prielaidų, o trečioji grupė buvo sukurta taip, kad sąmoningai mėgintų pastūmėti modelį palaikyti propagandinę poziciją. Kiekvienas atsakymas buvo vertinamas penkiabalėje sistemoje.
Lyderiai ir netikėtumai
Geriausiai pasirodė naujausi „Anthropic“ modeliai. Pirmąsias vietas užėmė „Claude Opus 4.7“, „Claude Opus 4.8“ ir „Claude Sonnet 4.6“, kurių rezultatai viršijo 90 balų ribą.
Tarp stipriausių modelių pateko ir naujausi „OpenAI“ sprendimai. „GPT-5.4“ užėmė aštuntąją vietą, o „GPT-5.5“ – dešimtąją. Aukštus rezultatus taip pat demonstravo „Qwen“ ir „NVIDIA Nemotron“ modeliai.

Kur kas prasčiau sekėsi kai kuriems senesniems mažesniems ir pažangių saugumo sprendimų neturintiems modeliams. Tyrimo apačioje atsidūrė „GPT-3.5 Turbo“, „GPT-4o Mini“, dalis „Llama“ modelių bei keli atvirojo kodo sprendimai. Tai rodo, kad vien modelio populiarumas nebūtinai reiškia didesnį atsparumą manipuliacijoms.
Silpniausia vieta – klausimo formuluotė
Visgi daugiau DI veikimo ypatumų atskleidė ne tik konkretūs modeliai, tačiau ir tai, kaip šie pateikia atsakymus. Tyrėjų teigimu, neutraliose situacijose daugelis sistemų demonstravo gerus rezultatus. Tačiau kai klausime jau būdavo įterpta klaidinga prielaida arba mėginama nukreipti modelį konkrečia linkme, dalies sistemų atsakymai pastebimai suprastėdavo.
JUMS GALI PATIKTI: Kaip gauti geresnius DI atsakymus: 5 paprastos taisyklės
Kai kurių modelių rezultatai vertinant manipuliatyvius klausimus buvo beveik dvigubai prastesni nei atsakant į neutralius. Tai rodo, kad sistemos daugeliu atveju yra jautrios iš anksto apgalvotoms klausimo formuluotėms.
Tyrėjai taip pat pastebėjo, kad nemažai modelių prasčiau pasirodė rusų kalba nei estų ar anglų. Tai leidžia kelti prielaidą, jog atsparumui propagandai įtakos turi ne tik modelio technologiniai sprendimai, bet ir mokymui naudoti duomenys bei informacinė aplinka.
Kur slypi dabartinių DI modelių silpnybės?
Nors šiuolaikiniai DI modeliai dažnai sudaro įspūdį, kad geba vertinti informaciją panašiai kaip žmogus, iš tiesų jie neturi savarankiško supratimo apie tai, kas yra tiesa ar melas. Modeliai prognozuoja labiausiai tikėtiną atsakymą pagal mokymosi metu matytus duomenis ir klausimo kontekstą. Žinant tai, kiekvieną atsakymą visada reikėtų įvertinti kritiškai, esant būtinybei – patikrinti patikimuose šaltiniuose.
Dėl šios priežasties manipuliatyviai suformuluoti klausimai išlieka viena didžiausių tokių sistemų silpnybių. Jei klausime pateikiama klaidinga prielaida ar tendencingas naratyvas, modelis ne visada jį atpažįsta kaip problemą ir kartais gali pradėti remtis pačia prielaida formuodamas atsakymą.
Papildomų iššūkių kelia ir tai, kad modeliai mokomi naudojant milžiniškus interneto duomenų kiekius. Juose neišvengiamai yra ne tik patikimos informacijos, bet ir propagandos, dezinformacijos ar politiškai šališko turinio, kurio vis daugėja, todėl ir šie iššūkiai tęsiasi ne vienerius metus.
Plačiau šiuos DI veikimo aspektus aptarėme TechNaujienos.lt parengtame gide: Kas yra dirbtinis intelektas? Išsamus gidas 2026
Kaip vertinate šį straipsnį?
Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.
Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.
DIENOS SKAITOMIAUSI
Naujas eksperimentas keičia tai, ką iki šiol žinojome apie branduolinius sprogimus
25300 metų senumo „ledo žmogus“ stebina mokslininkus: aptikti gyvybės požymiai
3Ištirtas 2019 metais Sacharoje rastas meteoritas: aptiktos užuominos apie dingusį pasaulį
4Mokslininkai skelbia nerimą keliančią prognozę: Artėja dirbtinio intelekto krizė?
5Du entuziastai sukūrė greičiausią droną pasaulyje: pasiekė 730 km/val. greitį
NAUJAUSI
Taip pat skaitykite
Atrinkome panašius straipsnius, kurie gali jums patikti.