Remiantis naujausiu pranešimu, norėdamos užsitikrinti aukštos kokybės duomenis savo dirbtinio intelekto modeliams mokyti, tokios dirbtinio intelekto bendrovės kaip „OpenAI“, „Google“ ir „Meta“ ėmėsi šešėlinės taktikos.
Nesąžininga „Google“ ir „OpenAI“ praktika
„New York Times“ pranešime teigiama, kad „OpenAI“ tariamai perrašė daugiau nei milijoną valandų „YouTube“ vaizdo įrašų, kad gautų duomenų savo pažangiausiam didelės kalbos modeliui (LLM) „GPT-4“ apmokyti.
Pranešama, kad „OpenAI“ sukūrė „Whisper“ garso transkripcijos modelį, kuris padėjo bendrovei surinkti duomenis iš „YouTube“ vaizdo įrašų.
„NY Times“ praneša, kad „OpenAI“ žinojo, jog šis metodas gali būti tikrinamas, tačiau jį taikė, nes manė, kad tai sąžiningas naudojimas.
Įdomu tai, kad „Google“, kuriai priklauso „YouTube“, taip pat buvo įtariama praktikuojanti tą patį savo dirbtinio intelekto modeliams, taip pažeisdama kūrėjų autorines teises.
„NY Times“ ataskaita atitinka „The Information“ ataskaitą, kurioje buvo pabrėžta, kad „OpenAI“, kaip įtariama, iš „YouTube“ vaizdo įrašų ir podkastų išėmė duomenis, kad galėtų apmokyti dvi savo dirbtinio intelekto sistemas. Ataskaitoje taip pat teigiama, kad komandoje dirbo „OpenAI“ prezidentas Gregas Brockmanas.
Dviprasmiški atsakymai
Kai „YouTube“ generalinis direktorius Neilas Mohanas davė interviu agentūrai „Bloomberg“, jis teigė, kad bendrovės politika „neleidžia atsisiųsti tokių dalykų kaip transkripcijos ar vaizdo įrašų fragmentai, o tai yra aiškus mūsų paslaugų teikimo sąlygų pažeidimas“.
Tačiau kai jo buvo paklausta, ar „OpenAI“ naudojosi „YouTube“ duomenimis, Mohanas atsakė dviprasmiškai:
„Mačiau pranešimų, kad jie galėjo būti naudojami arba ne. Pats neturiu jokios informacijos.“
„NY Times“ ataskaitoje taip pat teigiama, kad kai kurie „Google“ žmonės žinojo apie „OpenAI“ praktiką transkribuoti „YouTube“ duomenis, tačiau jie nieko negalėjo padaryti, nes „Google“ taip pat taikė tą pačią praktiką savo dirbtinio intelekto modeliui apmokyti.
Tačiau „Google“ „The NY Times“ teigė, kad vaizdo įrašų duomenų nuskaitymą atlieka tik gavusi vaizdo įrašo kūrėjo sutikimą.
Kaip teigiama pranešime, 2023 m. birželį „Google“ paprašė komandos „pakoreguoti privatumo politiką“, „kad „Google” galėtų pasinaudoti viešai prieinamais „Google“ dokumentais, restoranų apžvalgomis „Google Maps“ ir kita internetine medžiaga, kad galėtų naudoti daugiau savo dirbtinio intelekto produktų“.