
Meta ha ottenuto una storica vittoria in tribunale, dopo che un giudice ha stabilito che usare libri protetti da diritto d’autore per addestrare un’AI non costituisce necessariamente un illecito, ma può rientrare nelle tutele offerte dal principio di fair use. Ma la partita non è ancora conclusa: rimane la questione di come il colosso tecnologico abbia avuto accesso a quei libri.
L’azienda ha piratato oltre 80TB di libri, non pagando nulla ai rispettivi editori e autori. Il prossimo 11 luglio è atteso un nuovo incontro tra le parti proprio su questo nodo cruciale.
La questione dei libri piratati
Il giudice Vince Chhabria, pur concedendo in larga parte la richiesta di archiviazione da parte di Meta, ha stabilito che il prossimo 11 luglio si terrà un incontro tra le parti per decidere come procedere su questo punto, ancora aperto. Al centro del dibattito ci sono gli oltre 80 terabyte di dati scaricati da Meta da fonti come LibGen, una delle shadow library più note, utilizzati per l’addestramento dei suoi modelli linguistici.
Chhabria non ha accolto la tesi di Meta secondo cui il torrenting sarebbe “irrilevante” nella valutazione del fair use. Non solo c’è il mancato guadagno per gli autori, ma c’è anche un secondo e più dirimente tema: scaricando un numero così ingente di opere protette da diritto d’autore, Meta potrebbe aver portato ad un guadagno illecito per i siti pirata, amplificando (attraverso il seeding) la distribuzione del materiale pirata nella rete torrent.
Il nodo delle licenze andrà risolto
Se gli autori riuscissero a dimostrare che Meta, scaricando in massa questi contenuti, ha rafforzato le attività illegali di chi li distribuisce, la questione potrebbe cambiare volto. Tuttavia, Chhabria ha segnalato che al momento gli autori non hanno fornito prove sufficienti in tal senso.
Il procedimento è ancora aperto. Meta potrebbe trovarsi a dover chiarire se, nel fornire potenza di calcolo per la rete BitTorrent, abbia anche favorito indirettamente la diffusione non autorizzata delle opere altrui. In quel caso, le implicazioni legali sarebbero più complesse e, potenzialmente, ramificate.
Dalla sentenza emerge tuttavia anche uno spunto estremamente interessante. Nelle sue considerazioni, il giudice ammette che gli editori hanno perso la prima fase del processo perché hanno sollevato argomentazioni poco solide. Chhabria sostiene anche che il mercato delle licenze, in riferimento all’addestramento di AI avanzate, dovrà inevitabilmente cambiare.
E’ difficile credere che (gli editori ndr) non inizieranno presto a negoziare i diritti con i loro autori, in modo da poter avviare trattative e concessioni su larga scala con gli sviluppatori di modelli linguistici di grandi dimensioni, ammesso che non abbiano già iniziato a farlo
si legge nelle argomentazioni della sentenza. Abbiamo visto che questa dinamica è già diventata una realtà nel mondo del giornalismo: dopo una prima fase conflittuale, aziende come Meta e OpenAI hanno iniziato a negoziare accordi di licenza per l’uso degli archivi di realtà come il NY Times e la Washington Post per l’addestramento dei loro LLM.