Google leido OpenAI perrasyti milijona valandu YouTube vaizdo irašu GPT4 mokymui
„Google“ leido „OpenAI“ perrašyti milijoną valandų „YouTube“ vaizdo įrašų „GPT-4“ mokymui
Remiantis naujausiu pranešimu, norėdamos užsitikrinti aukštos kokybės duomenis savo dirbtinio intelekto modeliams mokyti, tokios dirbtinio intelekto bendrovės kaip „OpenAI“, „Google“ ir „Meta“ ėmėsi šešėlinės taktikos.
Nesąžininga „Google“ ir „OpenAI“ praktika
„New York Times“ pranešime teigiama, kad „OpenAI“ tariamai perrašė daugiau nei milijoną valandų „YouTube“ vaizdo įrašų, kad gautų duomenų savo pažangiausiam didelės kalbos modeliui (LLM) „GPT-4“ apmokyti.
Pranešama, kad „OpenAI“ sukūrė „Whisper“ garso transkripcijos modelį, kuris padėjo bendrovei surinkti duomenis iš „YouTube“ vaizdo įrašų.
„NY Times“ praneša, kad „OpenAI“ žinojo, jog šis metodas gali būti tikrinamas, tačiau jį taikė, nes manė, kad tai sąžiningas naudojimas.
Įdomu tai, kad „Google“, kuriai priklauso „YouTube“, taip pat buvo įtariama praktikuojanti tą patį savo dirbtinio intelekto modeliams, taip pažeisdama kūrėjų autorines teises.
„NY Times“ ataskaita atitinka „The Information“ ataskaitą, kurioje buvo pabrėžta, kad „OpenAI“, kaip įtariama, iš „YouTube“ vaizdo įrašų ir podkastų išėmė duomenis, kad galėtų apmokyti dvi savo dirbtinio intelekto sistemas. Ataskaitoje taip pat teigiama, kad komandoje dirbo „OpenAI“ prezidentas Gregas Brockmanas.
Dviprasmiški atsakymai
Kai „YouTube“ generalinis direktorius Neilas Mohanas davė interviu agentūrai „Bloomberg“, jis teigė, kad bendrovės politika „neleidžia atsisiųsti tokių dalykų kaip transkripcijos ar vaizdo įrašų fragmentai, o tai yra aiškus mūsų paslaugų teikimo sąlygų pažeidimas“.
Tačiau kai jo buvo paklausta, ar „OpenAI“ naudojosi „YouTube“ duomenimis, Mohanas atsakė dviprasmiškai:
„Mačiau pranešimų, kad jie galėjo būti naudojami arba ne. Pats neturiu jokios informacijos.“
„NY Times“ ataskaitoje taip pat teigiama, kad kai kurie „Google“ žmonės žinojo apie „OpenAI“ praktiką transkribuoti „YouTube“ duomenis, tačiau jie nieko negalėjo padaryti, nes „Google“ taip pat taikė tą pačią praktiką savo dirbtinio intelekto modeliui apmokyti.
Tačiau „Google“ „The NY Times“ teigė, kad vaizdo įrašų duomenų nuskaitymą atlieka tik gavusi vaizdo įrašo kūrėjo sutikimą.
Kaip teigiama pranešime, 2023 m. birželį „Google“ paprašė komandos „pakoreguoti privatumo politiką“, „kad „Google” galėtų pasinaudoti viešai prieinamais „Google“ dokumentais, restoranų apžvalgomis „Google Maps“ ir kita internetine medžiaga, kad galėtų naudoti daugiau savo dirbtinio intelekto produktų“.
Kaip vertinate šį straipsnį?
Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.
Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.
DIENOS SKAITOMIAUSI
Svarbus pokytis: pašto paslaugą šalyje galės teikti ne tik Lietuvos paštas
2„JPMorgan“ vadovas: Dirbtinis intelektas naikins darbo vietas, tačiau turintys šiuos įgūdžius išliks
3Rusija platina netikrus vaizdo įrašus, vaizduojančius pasiduodančias Ukrainos pajėgas
4Seimas patvirtino rekordinį gynybos biudžetą: 2026 metais gynybai – 4,79 mlrd. eurų
55 mokslininkai, kurie dingo be žinios po savo išradimų: tikros istorijos
Taip pat skaitykite
Atrinkome panašius straipsnius, kurie gali jums patikti.