Reddit je počeo postavljati nova ograničenja vezana uz sadržaje kojima neprofitni servis za arhiviranje Internet Archive može pristupiti, što će značajno ograničiti sposobnost alata te organizacije Wayback Machine za prikupljanje i pohranu podataka s Reddita.
Wayback Machine moći će od sad samo indeksirati početnu stranicu Reddita. Više neće moći pristupiti komentarima, stranicama subreddita, detaljima objava, profilima i drugim podacima.
Ovaj potez posljednji je korak koji je Reddit poduzeo u nastojanju ograničavanja mogućnost tvrtki za umjetnu inteligenciju u korištenju tuđih podataka za treniranje velikih jezičnih modela bez plaćanja naknada za licenciranje.
To je znatno drugačiji stav od onoga koji je tvrtka zauzela prošle godine, kada je izričito rekla da neće ograničavati “dobronamjerne aktere”, uključujući Internet Archive.
Nije jasno što se točno promijenilo od tada. Čini se kako u Redditu sad vjeruju kako tvrtke za umjetnu inteligenciju zaobilaze njegova pravila prikupljanjem podataka putem Wayback Machinea.
Licenciranje podataka postalo je značajan posao za Reddit. Tvrtka je sklopila višemilijunske ugovore s OpenAI-jem i Googleom koji im omogućuju korištenje objava s Reddita za obuku njihovih modela umjetne inteligencije.
Istovremeno, Reddit je zauzeo sve tvrđi stav protiv tvrtki koje pokušavaju koristiti njegove podatke bez takvih dogovora. Ranije ove godine tvrtka je tužila Anthropic, tvrdeći kako je taj startup godinama bez dopuštenja krao podatke s Reddita.
Pripremio: M.W.
Foto: Brett Jordan | Pexels



