Rinka buvo nustebinta neseniai išleisto Kinijos startuolo „DeepSeek“ R1 modelio pasiekimų. Be to, Kinijos startuolis atvėrė savo modelių kodus ir R1 tyrimo darbe atskleidė, kad itin pažangią dirbtinio intelekto sistemą pavyko išmokyti už dalį „OpenAI“ o1 modelio mokymo sąnaudų, dėl ko kelių didžiųjų technologijų kompanijų akcijos smuko. Prireikė laiko, tačiau „OpenAI“ vadovas Samas Altmanas pagaliau sureagavo į „DeepSeek“ sukelto ažiotažo bangą.
Kaip sureagavo S. Altmanas?
S. Altmanas pareiškė, kad džiaugiasi turėdamas naują konkurentą.
„DeepSeek R1 yra įspūdingas modelis, ypač vertinant tai, ką jie gali pasiūlyti už tokią kainą. Mes, žinoma, pristatysime daug geresnius modelius, tačiau tikrai džiugu turėti naują konkurentą“, – teigė „OpenAI“ įkūrėjas.
„OpenAI“ žada naujovių
Tikėtina, kad „OpenAI“ išleis naujas versijas, kurios gali būti susijusios su jau pristatytu o3 modeliu. Apie jį oficialiai turėtų būti pranešta artimiausiomis dienomis ar savaitėmis.
S. Altmanas taip pat teigė, kad jis su komanda labai džiaugiasi, galėdami galėdami toliau įgyvendinti savo tyrimų planą.
„Manome, kad didesni skaičiavimo pajėgumai dabar yra svarbesni nei bet kada anksčiau. Pasaulis norės naudoti daug dirbtinio intelekto, ir tikrai bus sužavėtas kitos kartos modeliais. Nekantraujame jums pristatyti AGI ir dar daugiau”, – sakė jis.
„DeepSeek“ pranašumai
Vis dėlto, nors „OpenAI“ paskelbė kelis pranešimus, siekdama atsakyti „DeepSeek“, tarp jų yra esminis skirtumas.
Kinijos startuolis naudoja tik 3–5 proc. išteklių, kurių „OpenAI“ reikia panašiai pažangai su „ChatGPT“ pasiekti.
Viena iš dabartinės dirbtinio intelekto programinės įrangos problemų yra susijusi su produkto kūrimo ir naudojimo sąnaudomis.
Tokių pažangių modelių, kaip o1, sukūrimas gali kainuoti dešimtis milijonų. Šiam procesui reikalingos aukštos klasės vaizdo plokštės (GPU), kurios užtikrina reikiamą skaičiavimo galią ir energijos sąnaudas.
Būtent dėl to galutiniai produktai, tokie kaip „ChatGPT o1“, negali būti nemokami be apribojimų. Tokios įmonės kaip „OpenAI“ turi padengti išlaidas ir siekti pelno.
Tuo tarpu „DeepSeek“ tyrėjai pasirinko kitą požiūrį kurdami R1 – jie surado būdų išmokyti pažangų samprotavimo modelį, neturėdami prieigos prie tokios pat įrangos.
Be to, „DeepSeek“ užtikrino, kad prieiga prie R1 būtų daug pigesnė nei „ChatGPT“, o tai yra reikšmingas pokytis.
Pridėjus dar ir „DeepSeek“ modelių atvirojo kodo pobūdį, tampa aišku, kodėl kūrėjai veržiasi išbandyti šios Kinijos įmonės DI ir kodėl „DeepSeek“ taip sparčiai populiarėja „App Store“.