Meta je za trening svojih modelov uporabljala spiratizirane knjige, potrjujejo razkrita elektronska sporočila, ki so jih morali pokazati v sodnem postopku, ki teče zaradi kolektivne tožbe proti OpenAI in Meti. Za urjenje modela LLaMA so s torrenti
prenesli 81,7 terabajta podatkov iz več spletnih arhivov, ki brez avtorskih pravic hranijo kopije knjig. To so na primer Anna's Archive, Z-Library in LibGen.
Minuli mesec je Meta uradno
priznala, da so z LibGena s torrenti pretočili na milijone knjig, a šele najnovejše razkritje elektronskih sporočil daje prave obrise obsega kršenja avtorskih pravic. V tožbi zoper Meto zato tožniki poudarjajo, da so sodišča v preteklosti za precej manjši obseg kršitev, denimo 0,008 odstotka Metinega prenosa knjig, v civilnih postopkih tožilstvu naznanila tudi kazniva dejanja.
Meta je zavlačevala in prikrivala dokumente, ki bi razkrili natančen obseg in način delovanja. A posamezni dokumenti, ki so jih tožniki pridobili,
razkrivajo celo nelagodje zaposlenih, da morajo na službenih računalnikih z interneta pretakati torrente. Izpostavljali so tudi, da je deljenje torrentov obojesmerni promet, zaradi česar je toliko bolj problematično, ker gre tudi za distribucijo. Meta zato za to početje ni uporabljala svojih strežnikov, da ne bi bilo možno deljenja (seeding) izslediti do nje.
V elektronskih sporočilih piše tudi, da je bil o početju seznanjen Mark Zuckerberg, ki je bil to predhodno zanikal. Meta medtem vztraja, da ji tožniki ne očitajo nobene konkretne kršitve avtorskih pravic in da ne morajo dokazati, da je kdorkoli drug od Mete prenesel kakšno knjigo oziroma da jih je Meta distribuirala.[st.slika 75229]