Mokslininkai palygino „GPT-4“ pagrįstos „ChatGPT“ ir radiologų diagnostikos tikslumą, naudodami 150 smegenų navikų MRT ataskaitų. Nustatyta, kad „ChatGPT“ pasiekė 73 % tikslumą, šiek tiek lenkdama neuroradiologus (72 %) ir bendruosius radiologus (68 %).
Sparčiai didėjantis dirbtinio intelekto vaidmuo radiologijoje
Dirbtinio intelekto modelio tikslumas buvo didžiausias (80 %) interpretuojant neuroradiologų parengtas ataskaitas, o tai rodo, kad jis gali padėti nustatyti medicinines diagnozes.
Šiame tyrime pabrėžiamas didėjantis dirbtinio intelekto vaidmuo radiologijoje ir jo ateities potencialas mažinti gydytojų darbo krūvį ir didinti diagnostikos tikslumą.
Tobulėjant dirbtiniam intelektui, jo panaudojimo galimybės realiose srityse vis labiau auga ir gali pranokti žmogaus kompetenciją.
Radiologijos srityje, kur teisinga diagnozė yra labai svarbi siekiant užtikrinti tinkamą paciento priežiūrą, dideli kalbos modeliai, tokie kaip „ChatGPT“, galėtų pagerinti tikslumą arba bent jau pasiūlyti antrąją nuomonę.
Tyrimo eiga
Siekdami išbandyti jo galimybes, Osakos Metropoliteno universiteto Medicinos aukštosios mokyklos absolventas Yasuhito Mitsuyama ir docento Daiju Ueda komanda vadovavo tyrėjams, kurie lygino „GPT-4“ grindžiamo „ChatGPT“ ir radiologų diagnostinius rezultatus 150 priešoperacinių smegenų auglių MRT ataskaitų.
Remiantis šiomis kasdienėmis klinikinėmis ataskaitomis, „ChatGPT“, dviejų sertifikuotų neuroradiologų ir trijų bendrosios praktikos radiologų buvo paprašyta pateikti diferencines diagnozes ir galutinę diagnozę.
Vėliau jų tikslumas buvo apskaičiuotas remiantis faktine naviko diagnoze po jo pašalinimo.
Rezultatai buvo tokie: „ChatGPT“ – 73 %, neuroradiologų – vidutiniškai 72 %, o bendrųjų radiologų – vidutiniškai 68 %.
Be to, „ChatGPT“ galutinės diagnozės tikslumas skyrėsi priklausomai nuo to, ar klinikinę ataskaitą rašė neuroradiologas, ar bendrosios praktikos radiologas.
Naudojant neuroradiologų ataskaitas tikslumas buvo 80 %, o naudojant bendrųjų radiologų ataskaitas – 60 %.
„Šie rezultatai rodo, kad „ChatGPT“ gali būti naudingas priešoperacinei smegenų auglių MRT diagnostikai“, – teigė magistrantas Mitsuyama.
Ateityje mokslininkai ketina ištirti didelius kalbos modelius kitose vaizdų diagnostikos srityse, siekdami sumažinti gydytojams tenkančią naštą, pagerinti diagnostikos tikslumą ir panaudoti dirbtinį intelektą edukacinei aplinkai palaikyti.