Ar tikitės, kad pavyks įveikti robotą žaidžiant stalo tenisą? Kompanija „Google DeepMind“ išmoko robotą žaisti šį žaidimą taip, kad jis prilygsta mėgėjų lygio varžyboms. Ji teigia, kad tai pirmas kartas, kai robotas buvo išmokytas žaisti sporto šaką su žmonėmis žmogaus lygiu.
Sėkmingas mokslininkų bandymas
Mokslininkams pavyko priversti roboto ranką, valdančią 3D spausdintuvu atspausdintą stalo teniso raketę, laimėti 13 iš 29 partijų prieš skirtingo pajėgumo varžovus žmones, žaidžiant visas stalo teniso varžybas. Tyrimai buvo paskelbti „Arxiv“ straipsnyje.
Sistema toli gražu nėra tobula. Nors stalo teniso robotas sugebėjo įveikti visus pradedančiųjų žaidėjų lygio varžovus ir 55 % mėgėjų lygio varžovų, jis pralaimėjo visus žaidimus su pažengusiais žaidėjais. Vis dėlto tai įspūdinga pažanga.
„Dar prieš kelis mėnesius prognozavome, kad realiai robotas gali nesugebėti laimėti prieš žmones, su kuriais anksčiau nebuvo žaidęs. Sistema tikrai pranoko mūsų lūkesčius“, – sako projektui vadovavęs „Google DeepMind“ vyresnysis programinės įrangos inžinierius Pannag Sanketi. „Tai, kaip robotas aplenkė net stiprius priešininkus, buvo pribloškiantis“.
Užmojai kur kas didesni
Tyrimai nėra vien tik linksmi ir smagūs žaidimai. Iš tikrųjų tai žingsnis link robotų, kurie galėtų sumaniai ir saugiai atlikti naudingas užduotis realioje aplinkoje, pavyzdžiui, namuose ir sandėliuose, sukūrimo, o tai yra ilgalaikis robotikos bendruomenės tikslas.
„Google DeepMind“ požiūris į mašinų mokymą pritaikomas daugelyje kitų sričių, sako Lerrel Pinto, Niujorko universiteto kompiuterių mokslo tyrėjas, nedirbęs prie šio projekto.
„Labai mėgstu matyti, kaip robotų sistemos iš tikrųjų dirba su tikrais žmonėmis ir šalia jų, ir tai yra puikus to pavyzdys“, – sako jis. „Galbūt tai nėra stiprus žaidėjas, tačiau yra žaliavos, leidžiančios toliau tobulėti ir galiausiai jį pasiekti.“
Kad taptų meistrišku stalo teniso žaidėju, žmonėms reikia puikios rankų ir akių koordinacijos, gebėjimo greitai judėti ir priimti greitus sprendimus reaguojant į varžovą – visa tai robotams yra nemenkas iššūkis.
Siekdami išmokyti sistemą imituoti šiuos gebėjimus, „Google DeepMind“ tyrėjai taikė dviejų dalių metodą: naudodami kompiuterinį modeliavimą jie mokė sistemą įvaldyti smūgiavimo įgūdžius; tada, naudodamiesi realaus pasaulio duomenimis, jie tiksliai suderino sistemą, todėl laikui bėgant ji gali tobulėti.
Tyrėjai surinko stalo teniso kamuoliuko būsenų duomenų rinkinį, įskaitant duomenis apie padėtį, sukimąsi ir greitį. Sistema naudojosi šia biblioteka imituojamoje aplinkoje, sukurtoje taip, kad tiksliai atspindėtų stalo teniso varžybų fiziką, kad išmoktų tokių įgūdžių, kaip grąžinti padavimą ir skirtingai smūgiuoti. Kadangi dėl roboto apribojimų jis negalėjo paduoti kamuoliuko, realaus pasaulio žaidimai buvo modifikuoti, kad tai būtų pritaikyta.
Rungtynių su žmonėmis metu robotas renka duomenis apie savo rezultatus, kad galėtų tobulinti savo įgūdžius. Jis seka kamuolio padėtį naudodamasis poros kamerų užfiksuotais duomenimis ir seka žmogaus varžovo žaidimo stilių naudodamas judesių fiksavimo sistemą, kuri naudoja ant varžovo irklo esančius šviesos diodus.
Duomenys apie kamuoliuką perduodami atgal į modeliavimo sistemą, kad būtų galima treniruotis, taip sukuriant nuolatinį grįžtamąjį ryšį.
Šis grįžtamasis ryšys leidžia robotui išbandyti naujus įgūdžius ir bandyti įveikti varžovą, t. y. jis gali koreguoti savo taktiką ir elgesį taip, kaip tai darytų žmogus. Tai reiškia, kad robotas tampa vis geresnis ir per konkrečias rungtynes, ir laikui bėgant, kuo daugiau rungtynių jis sužaidžia.
Sistema sunkiai pataikė į kamuoliuką, kai jis buvo smūgiuojamas labai greitai, už jos matymo lauko ribų (daugiau nei šešios pėdos virš stalo) arba labai žemai, nes pagal protokolą jai nurodyta vengti susidūrimų, kurie galėtų pažeisti jos raketę. Kamuoliukų sukimasis buvo iššūkis, nes jis neturėjo galimybės tiesiogiai matuoti sukimąsi – šiuo apribojimu pažangūs žaidėjai greitai pasinaudojo.
Roboto apmokymas visiems galimiems atvejams imituojamoje aplinkoje yra tikras iššūkis, sako projekte nedalyvavęs Chrisas Walti, robotikos bendrovės „Mytra“ įkūrėjas, anksčiau vadovavęs „Tesla“ robotikos komandai.
„Labai, labai sunku imituoti realų pasaulį, nes yra labai daug kintamųjų, pavyzdžiui, vėjo gūsis ar net dulkės [ant stalo]“, – sako jis. „Jei neturėsite labai tikroviško modeliavimo, roboto našumas bus ribotas.“
„Google DeepMind“ mano, kad šiuos trūkumus galima pašalinti keliais būdais, įskaitant prognozuojamų dirbtinio intelekto modelių, skirtų kamuolio trajektorijai numatyti, kūrimą ir geresnių susidūrimų aptikimo algoritmų diegimą.
Svarbiausia, kad žaidėjams žmonėms patiko rungtynės su roboto ranka. Net ir pažengę varžovai, kuriems pavyko ją įveikti, teigė, kad ši patirtis jiems pasirodė įdomi ir įtraukianti, ir teigė, kad, jų nuomone, robotas gali būti dinamiškas treniruočių partneris, padedantis tobulinti įgūdžius.
„Tikrai norėčiau turėti jį kaip treniruočių partnerį, su kuriuo kartais galėčiau sužaisti keletą rungtynių“, – sakė vienas iš tyrimo dalyvių.