L’8 settembre un gruppo di scrittori statunitensi ha presentato una class action presso il tribunale federale di San Francisco, accusando la società OpenAI di aver tratto profitto dall’uso non autorizzato e illegale dei loro prodotti editoriali protetti da copyright. Gli sviluppatori di ChatGPT sarebbero quindi colpevoli di violazione del diritto d’autore.
La causa prende il via dalla rilevazione della capacità di ChatGPT di riassumere e analizzare gli scritti di questi artisti, i quali sostengono che ciò sia possibile grazie al fatto che OpenAI ha addestrato il suo modello di linguaggio proprio utilizzando le loro opere. Nella causa si legge: “Gli atti di violazione del copyright da parte di OpenAI sono stati intenzionali e in totale disprezzo dei diritti dei querelanti e dei membri della class action […] OpenAI sapeva in ogni momento che i set di dati utilizzati per addestrare i suoi modelli GPT contenevano materiali protetti da copyright e che i suoi atti violavano i termini di utilizzo delle opere”.
È risaputo che ChatGPT, fin dalla sua prima versione, abbia letto e “inglobato” numerosi libri. OpenAI ha dichiarato che il 15% dei dati impiegati durante il primo addestramento dell’algoritmo aveva sfruttato “Books1” e “Books2”, senza specificare oltre; solo nel 2018 si è scoperto che l’azienda aveva utilizzato circa 7 mila romanzi presi da BookCorpus, un database di romanzi gratuiti che contiene più di 11.000 libri. Secondo le accuse dei querelanti, per le versioni successive di ChatGPT sarebbero stati sfruttati “senza consenso, credito o compenso per i suoi autori” anche alcuni romanzi presi dal sito Smashwords.com, che ospita opere disponibili gratuitamente ma comunque protette da copyright. L’accusa più grave, comunque, rimane quella di aver utilizzato anche library illegali, tra cui Genesis, Bibliotik e Z Library. Tramite tali piattaforme, ChatGPT avrebbe avuto accesso a circa 300 mila volumi.
Il gruppo di scrittori ha chiesto un risarcimento danni e il blocco delle “pratiche commerciali illegali e sleali di OpenAI”, che invece sostiene non sia illegale addestrare ChatGPT attraverso i testi disponibili in rete. L’ultima parola spetterà ai giudici.
M.M.