
Harry Potter, AI e copyright: il dilemma dei libri e Llama
Il recente studio accademico condotto da ricercatori di Stanford, Cornell e West Virginia ha rilanciato il dibattito sulle implicazioni legali ed etiche del training delle intelligenze artificiali con opere protette da copyright. In particolare, il caso di Llama 3.1 70B di Meta, capace di riprodurre fino al 42% di 'Harry Potter e la Pietra Filosofale', evidenzia quanto i Large Language Models possano memorizzare e restituire parti sostanziali di testi tutelati. Questo fenomeno desta preoccupazione tra autori, editori e giuristi, poiché mette sotto pressione le norme sulla proprietà intellettuale e apre interrogativi sull’uso non autorizzato e la divulgazione di contenuti originali. L’evoluzione rapida di questi modelli, che assimilano quantità crescenti di testi, spinge a interrogarsi sull’adeguatezza delle attuali regole e pratiche nel settore dell’AI generativa, soprattutto considerando la scarsa trasparenza nei dataset utilizzati per l’addestramento.
Dal punto di vista normativo, la riproduzione massiva di estratti letterari mette in discussione tre teorie chiave di violazione del copyright: la riproduzione non autorizzata, la creazione di opere derivate e la distribuzione illecita. Parallelamente, l’eccezione del fair use, spesso invocata dai produttori di AI, appare sempre meno difendibile quando i modelli arrivano a rigenerare interi capitoli o sequenze estese di opere famose. Nei principali ordinamenti occidentali (USA ed Europa), la giurisprudenza è ancora fluida, ma cresce la tendenza a distinguere tra estratti minimi e riproduzioni sostanziali, mentre aumentano i casi nei tribunali che coinvolgono autori, editori e le grandi società tech. La trasparenza sui dataset e l’introduzione di sistemi di autorizzazione e remunerazione diretta agli autori sono tra le possibili soluzioni allo studio, insieme a strumenti tecnologici di tracciamento dei contenuti nel training degli LLM.
Infine, il problema sollevato dalla memorizzazione AI di libri come 'Harry Potter' rappresenta una svolta nelle relazioni tra tecnologia, cultura e diritto. Gli scrittori temono la perdita di controllo sulle proprie opere e possibili danni economici, mentre per gli editori si discutono nuovi modelli di licenza o remunerazione automatica, simili a quelli della musica digitale. Il mondo accademico, l’industria e le istituzioni convergono su una necessità di confronto urgente: definire regole chiare e trasparenti che tutelino la creatività e la proprietà intellettuale negli scenari aperti dall’AI generativa. Solo così è possibile sfruttare le opportunità offerte dall’intelligenza artificiale senza compromettere i diritti degli autori, il valore dei cataloghi editoriali e, più in generale, il patrimonio culturale condiviso.