Praeitą savaitę „Apple“ savo kasmetinėje „WWDC“ konferencijoje pristatė rudens naujienas ir suteikė galimybę operacinių sistemų kūrėjams išbandyti būsimų įvykių beta versijas. Tarp šių naujienų yra ir DI transkripcijos įrankis, kuris bus integruotas „iOS 26“ ir „macOS“ operacinėse sistemose. Vienas iš nuolatinių „Apple“ pranešimų stebėtojų išbandė naujosios funkcijos galimybes ir, palyginęs su konkurentais, informavo apie stebinantį bendrovės sukurto įrankio greitį.
Nusprendė išbandyti naujienas
„MacStories“ autorius Johnas Voorheesas savo straipsnyje pristatė atliktą eksperimentą, kurio metu palygino „Apple“ transkripcijos įrankį pavadinimu „Yap“ su kitais populiariais tokio pobūdžio įrankiais, įskaitant „MacWhisper (Large V3 Turbo)“, „Vidcap“ ir „MacWhisper (Large V2)“.
Šie įrankiai turėjo transkribuoti 34 minučių trukmės 7G ir 4K vaizdo įrašo versiją bei sugeneruoti „SRT“ failą. Eksperimento rezultatai nustebino „Apple“ modelio konkurencingumu. Jis minėtą užduotį atliko vos per 45 sekundes.
Tuo tarpu „MacWhisper (Large V3 Turbo)“ užduotį atliko per 1 minutę ir 41 sekundę, „Vidcap“ – 1 minutę ir 55 sekundes, o „MacWhisper (Large V2)“ įvykdė užklausą per 3 minutes ir 55 sekundes.
Nors pats modelis žodžių tikslumu dar nėra nepriekaištingas ir nesugebėjo visų jų parašyti teisingai, tačiau jis buvo 55% greitesnis už „OpenAI“ modelį išlaikydamas tą patį kokybės lygį.
Greitis atneš esminį pokytį
Anot eksperimento autoriaus, nepaisant kokybės teksto lygmenyje, pats įrankio greitis galėtų tapti esminiu pokyčiu vartotojams, kurie kasdien susiduria su būtinybe naudoti transkripcijas iš įvairaus pobūdžio turinio, ypatingai tada, kai dėmesys krypsta į ilgo laiko garso turinį.
„Apple“ kasmetinėje konferencijoje pristatė ir daugiau naujienų. DI bus įgalinamas ir kitose srityse. Išmaniuosiuose įrenginiuose veiks „Visual Intelligence“ funkcija, kuri pagal turimą vaizdą atliks išmanią jo paiešką internete, „Apple Watch“ turės išmanų treniruočių asistentą, kuris įgarsins jų rodiklius, o vartotojus pasieks ir tiesioginio vertimo funkcija per „Messages“, „FaceTime“ ir telefoninių skambučių metu. Panašias naujienas yra pristačiusi ir nemokamų tekstinių pranešimų ir pokalbių programėlė „WhatsApp“, kuri leidžia gautas ilgas balso žinutes transkribuoti tekstiniu formatu, kai nėra galimybės jų išklausyti.