Naujasis „OpenAI“ balso sintezatorius gali nukopijuoti jūsų balsą iš vos 15 sekundžių garso įrašo

Pastaraisiais metais „OpenAI“ sparčiai tobulino savo generatyvinio dirbtinio intelekto pokalbių robotą „ChatGPT“ ir dirbtinio intelekto vaizdo įrašų kūrėją „Sora“, o dabar pristato naują dirbtinio intelekto įrankį: „Voice Generation“, kuris geba sukurti sintetinius balsus iš vos 15 sekundžių garso įrašo.

Vykdomi „Voice Engine“ tikrinimo darbai

Tinklaraščio įraše „OpenAI“ teigia, kad vykdo „nedidelės apimties išankstinę peržiūrą“ programos „Voice Engine“, kuri buvo kuriama nuo 2022 m. pabaigos. Iš tikrųjų ji jau naudojama „ChatGPT“ programėlės „Read Aloud“ funkcijoje, kuri (kaip rodo pavadinimas) perskaito jums atsakymus.

Kai balsą išmokysite iš 15 sekundžių trukmės pavyzdžio, galėsite priversti jį perskaityti bet kokį norimą tekstą „emocingai ir tikroviškai“. „OpenAI“ teigia, kad šią sistemą galima naudoti švietimo tikslais, verčiant podkastus į naujas kalbas, norint pasiekti atokias bendruomenes ir padėti žmonėms, kurie nekalba.

Tai nėra tai, kuo kiekvienas gali naudotis jau dabar, tačiau galite eiti ir klausytis „Voice Engine“ sukurtų pavyzdžių. „OpenAI“ paskelbti įrašai skamba gana įspūdingai, nors juose jaučiamas nedidelis robotiškumas ir susikaustymas.

Taip pat skaitykite

Pirmiausia – saugumas

Pagrindinė priežastis, kodėl „Voice Engine“ kol kas yra tik ribotos peržiūros versija, yra susirūpinimas dėl netinkamo naudojimo. „OpenAI“ teigia norinti atlikti daugiau tyrimų, kaip apsaugoti tokius įrankius, kad jie nebūtų naudojami dezinformacijai skleisti ir balsams kopijuoti be sutikimo.

„Tikimės pradėti dialogą apie atsakingą sintetinių balsų diegimą ir apie tai, kaip visuomenė gali prisitaikyti prie šių naujų galimybių“, – sako „OpenAI“. „Remdamiesi šiais pokalbiais ir šių nedidelio masto bandymų rezultatais, priimsime labiau pagrįstą sprendimą, ar ir kaip šią technologiją diegti platesniu mastu.“

Šiais metais JAV ir Jungtinėje Karalystėje vyks svarbūs rinkimai, o generatyvinio dirbtinio intelekto įrankiai nuolat tobulėja, todėl susirūpinimą kelia visų tipų dirbtinio intelekto turinys – garso, teksto ir vaizdo – ir vis sunkiau žinoti, kuo pasitikėti.

Kaip nurodo pati „OpenAI“, dėl to gali kilti problemų, susijusių su balso autentiškumo nustatymo priemonėmis ir sukčiavimu, kai galite nežinoti, su kuo kalbate telefonu arba kas jums paliko balso pranešimą. Šias problemas nėra lengva išspręsti, tačiau turėsime rasti būdų, kaip jas spręsti.

Patiko? Nusiųsk draugui:

Sekite mūsų naujienas Google News aplikacijoje:

Naujienos iš interneto

traffix.lt