Dirbtinis intelektas gali pateikti atsakymus į įvairius klausimus, nuo kasdienių neaiškumų iki moksliniams tyrimams reikalingos informacijos, tačiau ar galime juo pasitikėti? Praktika rodo, kad dirbtinio intelekto paieškos sistemoms kyla iššūkių dėl informacijos patikimumo ir jos citavimo.
Tyrimo rezultatai patvirtina nuogąstavimus
Kolumbijos universiteto skaitmeninės žurnalistikos centras „Tow Center for Digital Journalism“ atliko tyrimą, kurio metu nustatyta, kad pokalbių robotai paprastai negalėdami tiksliai atsakyti į klausimus, vietoj atsisakymo pateikdavo neteisingus arba spekuliatyvius atsakymus.
Tyrimo metu išanalizuoti aštuoni generatyvaus dirbtinio intelekto paieškos įrankiai: „ChatGPT“, „Perplexity“, „Perplexity Pro“, „Copilot“, „Gemini“, „Grok 2“, „Grok 3“ ir „DeepSeek“. Įrankiai turi tiesioginės paieškos funkciją, kuri leidžia analizuoti ir cituoti naujienų turinį.
Tyrimo metu dėmesys buvo nukreiptas ir į tai, kaip šios paieškos sistemos elgiasi, kai jiems nepavyksta pasiekti naujienų turinio.
Bendra tyrimo statistika rodo, kad daugiau nei 60 % atsakymų į užklausas buvo su neteisingais atsakymais. Pavyzdžiui, „Perplexity“ klaidų lygis siekė 37 %, o „Grok 3“ į 94 % užklausų atsakė neteisingai.
Išvados kelia nerimą
Pastebėta, kad keli pokalbių robotai buvo linkę sulaužyti robotų išskyrimo protokolo (angl. Robot Exclusion Protocol) taisykles, kuriomis tam tikros svetainės dalys yra apribojamos nuo turinio nuskaitymo.
Taip pat generatyvieji paieškos įrankiai kūrė fiktyvias nuorodas ir citavo trečiųjų šalių perspausdintas bei nukopijuotas straipsnių versijas, o turinio licencijavimo sandoriai su naujienų šaltiniais negarantavo tikslios citatos atsakymuose.
Testų metu nustatyta ir tai, kad paieškos sistemos, netgi ir mokamos su aukštesnės klasės modeliais, pasitiki pateikdamos neteisingus atsakymus, nes juose nėra tokių pasakymų, kaip „yra tikimybė“, „atrodo“ ar „neradau tikslaus straipsnio“.
Citavimas – dar viena problema
Tyrimas parodė ir dar vieną iššūkį – turinio citavimą. Tirtų paieškos įrankių tikrintuvų pavadinimai yra skelbiami viešai, todėl svetainių savininkai gali juos blokuoti.
Visgi pastebėta, kad pokalbių robotai dažnai atsako neteisingai į tas užklausas prie kurių duomenų jie prieiti gali, o teisingus atsakymus pateikia ten, kur jų prieiga prie duomenų yra ribojama.
Pokalbių robotai susidūrė ir su iššūkiais cituojant pirminius šaltinius. Pavyzdžiui, „DeepSeek“ 115 kartų iš 200 klaidingai nurodė tyrėjų užklausose pateiktų ištraukų šaltinį.
Pasitikėjimo dilemos dar neleidžia pakeisti tradicinių paieškos metodų
Dar per dažnos dirbtinio intelekto paieškos sistemų daromos klaidos neleidžia joms pranokti tradicinių paieškos sistemų.
Didėjant dirbtinio intelekto plėtrai artėjančiais metais stebėsime tolesnį šios technologijos pažangos procesą, tačiau bent kol kas turėtume būti linkę tikrinti faktus, susirasti pirminius šaltinius ir juos teisingai cituoti.