Prema nedavnom izvješću, temeljne kreativne industrije – osobito one koje proizvode knjige, softver za zabavu, periodike, filmove, snimljenu glazbu, televiziju i video igre – dodale su 1,8 bilijuna dolara američkom BDP -u 2021. godine.
To je gotovo osam posto američkog gospodarstva. Stoga nije mala stvar to što tvrtke koje se bave umjetnom inteligencijom nelicencirane materijale zaštićene autorskim pravima iz tih industrija za osposobljavanje svojih modela. Zbog toga je podneseno više od 40 tužbi američkim saveznim sudovima.
Dva suda već su donijela prve dvije odluke o takvim slučajevima. Niti jedna od njih nije bila osobito pozitivna za pravo vlasnike autorskih prava.
Kakve pouke možemo izvući iz dosadašnjeg utjecaja generativne inteligencije na poslovanje?
Lekcije za vlasnike autorskih prava
Možete poduzeti nekoliko koraka kako biste zaštitili svoje poslovanje.
Primjerice, moguće je ukloniti materijal zaštićen autorskim pravima iz korpusa za trening. Za to nije prekasno – svaku novu generaciju velikih jezičnih modela iznova se obučava na raspoloživim podacima. Ako uklonite svoje materijale sad, neće se naći u idućem izdanju.
Moguće je pravno pritisnuti tvrtke koje koriste zaštićene materijale bez licence. Dosadašnje parnice u SAD-u pokazuju kako taj pristup ima izgleda za uspjeh ako se sud uvjeri kako bi besplatno obučavanje modela umjetne inteligencije moglo ugroziti prihode ili opstanak vlasnika autorskih prava.
HarperCollins, Universal Music, Reddit, Shutterstock i Wall Street Journal su među onima koji su licencirali svoje sadržaje za obuku umjetne inteligencije. Tvrtke koje ju razvijaju možda će biti spremne platiti za licencu sadržaja kako bi dobili čist, pouzdan i kurirani skup podataka odmah umjesto nasumično skupljenih na webu i čekanja na odluke sudova.
Moguća je opcija, iako ne i svima dostupna, uklanjanje zaštićenih sadržaja s otvorenog weba, odnosno stavljanje sadržaja iza paywalla ili drugih oblika zaštite.
Neke tvrtke koriste model u kojem potrošačima nude pojedine sadržaje besplatno i naplaćuju za pristup cjelokupnom ili većoj količini sadržaja.
Zaštitite autorski sadržaj na otvorenom webu. Nekoliko je načina kako to možete učiniti, iako nijedan od njih nije savršen.
Tako, recimo, možete koristiti datoteku robots.txt kako biste robote koji prikupljaju sadržaj odvratili od prikupljanja s vašeg web odredišta.
Ovo će, doduše, funkcionirati samo ako ti roboti odluče postupiti u skladu s tom uputom, ali bolje išta nego ništa.
Tvrtke koje se bave web hostingom mogu blokirati robote za prikupljanje podataka ili naplaćivati pristup podacima.
Postoje i novi alati, kao što su Glaze ili Nightshade, koji mogu zaštititi javno dostupno slikovno intelektualno vlasništvo.
Lekcije za tvrtke koje se bave umjetnom inteligencijom
Neovlašteno korištenje i dalje predstavlja financijski rizik. U barem jednoj presudi ostavljena je mogućnost podnošenja tužbe zbog piratiziranja sadržaja.
Američki zakon to kažnjava odštetama u rasponu od 30 do 150 tisuća USD, što može biti multiplicirano u slučaju višestrukog kršenja zakona.
Ishodite licence. To je najbrži način kako riješiti problem i ne doći u sukob sa zakonom.
Olakšajte uklanjanje zaštićenih sadržaja. Takve alate već koriste, primjerice, Facebook i YouTube. Sad je pravo vrijeme da to učine i tvrtke koje se bave umjetnom inteligencijom.
Isplati li se riskirati s nelicenciranim podacima? Eleuther.ai, organizacija za istraživanje umjetne inteligencije, nedavno je objavila skup podataka veličine osam terabajta, nazvan Common Pile V0.1, za koji tvrdi kako je u cijelosti sastavljen od otvorenog računalnog koda ili licenciranog sadržaja. Veliki jezični modeli koje su obučili na njemu navodno su radili podjednako dobro kao i oni koji su koristili nelicencirane sadržaje.
Generativna umjetna inteligencija može na puno načina biti korisna industriji i društvu. No, postizanje tog potencijala zahtijevat će robusnija i transparentnija partnerstva između tehnoloških tvrtki i kreativne industrije, piše Harvard Business Review.
Pripremio: M.W.
Foto: Gülfer Ergin | Unsplash



