Naujasis OpenAI balso sintezatorius gali nukopijuoti jusu balsa is vos 15 sekundziu garso iraso
Naujasis „OpenAI“ balso sintezatorius gali nukopijuoti jūsų balsą iš vos 15 sekundžių garso įrašo
Pastaraisiais metais „OpenAI“ sparčiai tobulino savo generatyvinio dirbtinio intelekto pokalbių robotą „ChatGPT“ ir dirbtinio intelekto vaizdo įrašų kūrėją „Sora“, o dabar pristato naują dirbtinio intelekto įrankį: „Voice Generation“, kuris geba sukurti sintetinius balsus iš vos 15 sekundžių garso įrašo.
Vykdomi „Voice Engine“ tikrinimo darbai
Tinklaraščio įraše „OpenAI“ teigia, kad vykdo „nedidelės apimties išankstinę peržiūrą“ programos „Voice Engine“, kuri buvo kuriama nuo 2022 m. pabaigos. Iš tikrųjų ji jau naudojama „ChatGPT“ programėlės „Read Aloud“ funkcijoje, kuri (kaip rodo pavadinimas) perskaito jums atsakymus.
Kai balsą išmokysite iš 15 sekundžių trukmės pavyzdžio, galėsite priversti jį perskaityti bet kokį norimą tekstą „emocingai ir tikroviškai“. „OpenAI“ teigia, kad šią sistemą galima naudoti švietimo tikslais, verčiant podkastus į naujas kalbas, norint pasiekti atokias bendruomenes ir padėti žmonėms, kurie nekalba.
Tai nėra tai, kuo kiekvienas gali naudotis jau dabar, tačiau galite eiti ir klausytis „Voice Engine“ sukurtų pavyzdžių. „OpenAI“ paskelbti įrašai skamba gana įspūdingai, nors juose jaučiamas nedidelis robotiškumas ir susikaustymas.
Pirmiausia – saugumas
Pagrindinė priežastis, kodėl „Voice Engine“ kol kas yra tik ribotos peržiūros versija, yra susirūpinimas dėl netinkamo naudojimo. „OpenAI“ teigia norinti atlikti daugiau tyrimų, kaip apsaugoti tokius įrankius, kad jie nebūtų naudojami dezinformacijai skleisti ir balsams kopijuoti be sutikimo.
„Tikimės pradėti dialogą apie atsakingą sintetinių balsų diegimą ir apie tai, kaip visuomenė gali prisitaikyti prie šių naujų galimybių“, – sako „OpenAI“. „Remdamiesi šiais pokalbiais ir šių nedidelio masto bandymų rezultatais, priimsime labiau pagrįstą sprendimą, ar ir kaip šią technologiją diegti platesniu mastu.“
Šiais metais JAV ir Jungtinėje Karalystėje vyks svarbūs rinkimai, o generatyvinio dirbtinio intelekto įrankiai nuolat tobulėja, todėl susirūpinimą kelia visų tipų dirbtinio intelekto turinys – garso, teksto ir vaizdo – ir vis sunkiau žinoti, kuo pasitikėti.
Kaip nurodo pati „OpenAI“, dėl to gali kilti problemų, susijusių su balso autentiškumo nustatymo priemonėmis ir sukčiavimu, kai galite nežinoti, su kuo kalbate telefonu arba kas jums paliko balso pranešimą. Šias problemas nėra lengva išspręsti, tačiau turėsime rasti būdų, kaip jas spręsti.
Kaip vertinate šį straipsnį?
Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.
Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.
DIENOS SKAITOMIAUSI
Kodėl apie 40-uosius staiga ima trūkti energijos: mokslininkai paaiškino priežastis
2Šis kasdienis gėrimas gali sumažinti demencijos riziką – ką atskleidė tyrimas
3Jei sustotų internetas: ar visuomenė sugebėtų gyventi be jo?
4Šokiruojanti E. Musko prognozė dėl DI pabaigos Žemėje: „Liko vos keli mėnesiai“
5Kas nutiktų, jei būtų panaudotas taktinis branduolinis ginklas Europoje?
NAUJAUSI
Taip pat skaitykite
Atrinkome panašius straipsnius, kurie gali jums patikti.