Naujasis OpenAI balso sintezatorius gali nukopijuoti jusu balsa is vos 15 sekundziu garso iraso
Naujasis „OpenAI“ balso sintezatorius gali nukopijuoti jūsų balsą iš vos 15 sekundžių garso įrašo
Pastaraisiais metais „OpenAI“ sparčiai tobulino savo generatyvinio dirbtinio intelekto pokalbių robotą „ChatGPT“ ir dirbtinio intelekto vaizdo įrašų kūrėją „Sora“, o dabar pristato naują dirbtinio intelekto įrankį: „Voice Generation“, kuris geba sukurti sintetinius balsus iš vos 15 sekundžių garso įrašo.
Vykdomi „Voice Engine“ tikrinimo darbai
Tinklaraščio įraše „OpenAI“ teigia, kad vykdo „nedidelės apimties išankstinę peržiūrą“ programos „Voice Engine“, kuri buvo kuriama nuo 2022 m. pabaigos. Iš tikrųjų ji jau naudojama „ChatGPT“ programėlės „Read Aloud“ funkcijoje, kuri (kaip rodo pavadinimas) perskaito jums atsakymus.
Kai balsą išmokysite iš 15 sekundžių trukmės pavyzdžio, galėsite priversti jį perskaityti bet kokį norimą tekstą „emocingai ir tikroviškai“. „OpenAI“ teigia, kad šią sistemą galima naudoti švietimo tikslais, verčiant podkastus į naujas kalbas, norint pasiekti atokias bendruomenes ir padėti žmonėms, kurie nekalba.
Tai nėra tai, kuo kiekvienas gali naudotis jau dabar, tačiau galite eiti ir klausytis „Voice Engine“ sukurtų pavyzdžių. „OpenAI“ paskelbti įrašai skamba gana įspūdingai, nors juose jaučiamas nedidelis robotiškumas ir susikaustymas.
Pirmiausia – saugumas
Pagrindinė priežastis, kodėl „Voice Engine“ kol kas yra tik ribotos peržiūros versija, yra susirūpinimas dėl netinkamo naudojimo. „OpenAI“ teigia norinti atlikti daugiau tyrimų, kaip apsaugoti tokius įrankius, kad jie nebūtų naudojami dezinformacijai skleisti ir balsams kopijuoti be sutikimo.
„Tikimės pradėti dialogą apie atsakingą sintetinių balsų diegimą ir apie tai, kaip visuomenė gali prisitaikyti prie šių naujų galimybių“, – sako „OpenAI“. „Remdamiesi šiais pokalbiais ir šių nedidelio masto bandymų rezultatais, priimsime labiau pagrįstą sprendimą, ar ir kaip šią technologiją diegti platesniu mastu.“
Šiais metais JAV ir Jungtinėje Karalystėje vyks svarbūs rinkimai, o generatyvinio dirbtinio intelekto įrankiai nuolat tobulėja, todėl susirūpinimą kelia visų tipų dirbtinio intelekto turinys – garso, teksto ir vaizdo – ir vis sunkiau žinoti, kuo pasitikėti.
Kaip nurodo pati „OpenAI“, dėl to gali kilti problemų, susijusių su balso autentiškumo nustatymo priemonėmis ir sukčiavimu, kai galite nežinoti, su kuo kalbate telefonu arba kas jums paliko balso pranešimą. Šias problemas nėra lengva išspręsti, tačiau turėsime rasti būdų, kaip jas spręsti.
Kaip vertinate šį straipsnį?
Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.
Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.
DIENOS SKAITOMIAUSI
Jūsų telefonas turi „galiojimo datą“: kaip ją sužinoti
2Kas nutinka žmogaus DNR po mirties? Mokslininkai turi atsakymą
3Manote, kad telefonas jūsų klausosi? Štai kur galite pamatyti, kas naudojo mikrofoną
4Visi būdai, kuriais telefonas gali sekti jūsų buvimo vietą – ir ką verta išjungti
5Paskelbtos svarbiausios 2026 m. technologijos: nuo tikslesnio vėžio gydymo iki duomenų apsaugos
NAUJAUSI
Taip pat skaitykite
Atrinkome panašius straipsnius, kurie gali jums patikti.