Viena iš naujausių tendencijų generatyvinio dirbtinio intelekto srityje yra dirbtinio intelekto (DI) agentai, o „Google“ šiuo metu ruošia savo agentą, kuris bus būsimo „Gemini“ didelio kalbos modelio (LLM) funkcija.
Šis kūrinys, pavadintas „Project Jarvis“, yra „Google Chrome“ naršyklėje sukurtas dirbtinio intelekto agentas, kuris, gavęs trumpą užklausą ar komandą, galės savarankiškiau nei anksčiau atlikti įprastas užduotis.
Pranešama, kad dirbtinio intelekto agentų įtraukimas į kitą „Chrome“ atnaujinimą gali būti didžiausia pertvarka nuo 2008 m., kai naršyklė buvo pradėta naudoti.
Daug žadantis „Project Jarvis“ modelis
„Google“ jau pademonstravo, kaip „Gemini“ gali būti apsipirkimo kompanionas arba kelionių planuotojas, naudodamas dabartinį „Gemini 1.5 Pro“ modelį, kuris palaiko „Gemini Advanced“ pokalbių robotą.
Būsimajame modelyje „Project Jarvis“ galės atlikti daugybę užduočių, spręsdamas įvairias užduotis, pavyzdžiui, lankydamasis svetainėse, pildydamas formas ir atlikdamas mokėjimus, kad užbaigtų naudotojo pateiktą užklausą.
Pavyzdžiui, „Jarvis“ greičiausiai galėtų atlikti užklausą „suplanuokite man atostogas gruodžio mėn., turint 1 000 EUR biudžetą“ arba „užsakykite skrydžius ir viešbutį ir atsiųskite informaciją į mano el. paštą“.
„Jarvis“ yra panašus į Tonio Starko dirbtinio intelekto asistentą filme „Geležinis žmogus“. Nors oficialus pavadinimas kol kas nežinomas, kodinis pavadinimas tinka, nes „Google“ didina savo modelio galimybes.
Išsamesne informacija apie dirbtinio intelekto agentus „Google“ dalijosi nuo gegužės mėnesio per „Google I/O“ programuotojų konferenciją, kurioje pažymėjo, kad ši technologija padės apdoroti kalbos ir vaizdo turinį ir leis greičiau reaguoti į pokalbius.
Naujienų galime laukti jau gruodžio pradžioje
Kaip minėta, projektas „Jarvis“ gali būti tarp kito „Google“ LLM, kuris, kaip kalbama, bus „Gemini 2.0“, funkcijų. Apie generatyvinį dirbtinį intelektą gali būti paskelbta gruodžio pradžioje, tačiau kol kas nepranešama, kaip plačiai jis bus prieinamas.
Kol „Google“ ruošiasi išleisti savo dirbtinio intelekto agentą, daugelis kitų prekės ženklų jau pademonstravo panašias funkcijas.
Pavyzdžiui, „Anthropic“ neseniai atskleidė savo „Computer Use“ agentą, kuris leidžia „Claude LLM“ įrenginio naudotojui savarankiškai atlikti užduotis. Šiuo metu ši funkcija yra beta versijoje.
Panašiai veikia ir „OpenAI“ „Swarm Framework“ – tai agentų, kurie kartu atlieka užduotis, sistema. Kompanija pareiškė, kad ši technologija tebėra mokslinių tyrimų ir mokomųjų eksperimentų etape.