Naujausio tyrimo duomenimis, žmonėms, norintiems suprasti savo šunis, gali padėti dirbtinis intelektas.
Kuriamos naujos priemonės
Mičigano universiteto mokslininkai kuria priemones, kurios gali nustatyti, ar šuns lojimas išreiškia žaismingumą, ar agresiją. Kartu jie tikisi iš gyvūnų vokalizacijų suprasti ir kitą informaciją, pavyzdžiui, gyvūno amžių, veislę ir lytį.
Bendradarbiaudama su Meksikos nacionaliniu astrofizikos, optikos ir elektronikos institutu, Mičigano komanda nustatė, kad dirbtinio intelekto modeliai, iš pradžių apmokyti žmogaus kalbai, gali būti naudojami kaip atspirties taškas naujoms sistemoms, skirtoms gyvūnų bendravimui, mokyti.
Rezultatai buvo pristatyti Jungtinėje tarptautinėje kompiuterinės lingvistikos, kalbos išteklių ir vertinimo konferencijoje.
„Naudodami kalbos apdorojimo modelius, iš pradžių apmokytus žmonių kalbai, mūsų tyrimai atveria naują galimybę, kaip galime panaudoti tai, ką iki šiol sukūrėme kalbos apdorojimo srityje, kad pradėtume suprasti šunų lojimo niuansus“, – teigė Rada Mihalcea, kolegijos informatikos ir inžinerijos profesorė, ir Janice M. Jenkins, U-M dirbtinio intelekto laboratorijos, kuri atliko šį darbą, direktorė.
„Mes dar tiek daug nežinome apie gyvūnus, kurie gyvena kartu su mumis šiame pasaulyje. Pasitelkus dirbtinio intelekto pasiekimus galima iš esmės pakeisti mūsų supratimą apie gyvūnų bendravimą, o mūsų išvados rodo, kad galbūt nereikės pradėti nuo nulio“, – sakė ji.
Tačiau, nors žmonių kalbos DI modeliai mokomi iš didžiulio rašytinių tekstų, šunų balsai įrašomi rečiau nei žmonių.
Siekdami įveikti šią problemą, tyrėjai iš naujo naudoja esamą modelį, kuris iš pradžių buvo sukurtas žmogaus kalbai analizuoti. Fondas iš įvairių balso technologijų buvo išmokytas atrinkti svarbius žmogaus kalbos bruožus, tokius kaip tonas, garso aukštis ir akcentas.
„Šie modeliai gali išmokti ir užkoduoti neįtikėtinai sudėtingus žmogaus kalbos ir kalbėjimo modelius“, – sakė pagrindinis autorius ir doktorantas Artemas Abzaljevas.
DI tikslumas siekia iki 70 proc.
Naudodami žmogaus kalbos modelį „Wav2Vec2“, tyrėjai sukūrė šunų vokalizacijų, įrašytų 74 skirtingos veislės, amžiaus ir lyties šunų įvairiomis aplinkybėmis, duomenų rinkinį.
Jie nustatė, kad „Wav2Vec2“ pagerino kitus modelius, specialiai apmokytus šunų lojimo duomenims apdoroti – tikslumas siekė iki 70 proc. – ir sėkmingai atliko keturias klasifikavimo užduotis.
Kaip renkami duomenys apie šunų lojimą?
Tyrėjai fiksuoja šunų lojimą įvairiose situacijose: žaidimo, agresijos ir kt. Tada jie tikrina modelio gebėjimą atpažinti lojimo pavyzdžius: labai agresyvus lojimas nepažįstamojo akivaizdoje; įprastas lojimas nepažįstamojo akivaizdoje; neigiamas lojimas; neigiamas urzgimas (nepažįstamojo akivaizdoje). Taigi tyrėjai žino, kuris yra kuris, nes jau žino lojimo kontekstą.
„Tai pirmas kartas, kai žmonių kalbai optimizuoti metodai buvo panaudoti gyvūnų bendravimui dekoduoti“, – sakė Mihalcea. „Mūsų rezultatai rodo, kad garsai ir modeliai, gauti iš žmogaus kalbos, gali būti pagrindas analizuojant ir suprantant kitų garsų, pavyzdžiui, gyvūnų vokalizacijų, akustinius modelius.“