Sono oggi sempre più diffusi sistemi di intelligenza artificiale “creativi” che, attraverso meccanismi di apprendimento automatico profondo (deep learning) implicanti un addestramento su imponenti set di dati, tipicamente reperiti online, sono in grado di generare immagini, testo, o linee di codice a partire da un semplice testo in pochi secondi.

Le potenzialità dischiuse dalle modalità di apprendimento dell’IA devono fare i conti, nel campo della creatività, con le problematiche giuridiche relative alla tutela del diritto d’autore. Invero, l’enorme mole di dati presenti su Internet che vanno a comporre i set di dati utilizzati per il training dell’algoritmo (raccolti tramite c.d. web-scraping, ossia estrazione, “raschiamento”, di dati dal web) comprende naturalmente anche contenuti coperti da copyright.

Si sta dunque assistendo, in queste settimane, al proliferare di azioni legali intraprese da titolari di diritti d’autore nei confronti di alcune delle principali società produttrici di strumenti IA, addestrati utilizzando milioni di materiali online protetti da copyright senza il consenso del legittimo titolare.

Le prime azioni legali negli USA e in UK

Una prima azione giudiziaria di questo tipo è stata avviata dinnanzi alla Corte Federale di San Francisco il 3 novembre 2022, contro le società GitHub, Microsoft (proprietaria di GitHub) e OpenAI. I relativi software di intelligenza artificiale, GitHub Copilot e OpenAI Codex, sono software generatori di linee di codici, i quali avrebbero sfruttato l’enorme mole di codici altrui presenti nella piattaforma open-source di GitHub per produrre propri codici, senza rispettare i diritti di licenza degli utenti come disciplinati dai termini e condizioni d’uso della piattaforma stessa.

Sempre negli USA, a gennaio 2023, le artiste Sarah Andersen, Kelly McKernan e Karla Ortiz hanno promosso una class action volta a contestare la legalità dei software generatori di immagini Stable Diffusion, Midjourney e DreamUp, facenti capo, rispettivamente, alle aziende Stability AI, Midjourney e DeviantArt. In particolare, il trio di artiste ha contestato la violazione dei propri diritti d’autore, insieme a quelli di un imprecisato, estesissimo numero di artisti, tramite l’addestramento delle IA su database online contenenti miliardi di immagini e fotografie – tra cui le proprie -, a cui le società hanno attinto senza il consenso dei legittimi titolari per addestrare i rispettivi software e permetter loro di creare opere artistiche che riproducono lo stile e le caratteristiche delle altrui creazioni immagazzinate e rielaborate. I profili di illegittimità prospettati dalle artiste non coinvolgono dunque le sole modalità di apprendimento delle IA, estendendosi anche agli output da esse generati, in ragione della frequente somiglianza tra il prodotto finale dell’algoritmo e l’opera altrui protetta.

Parallelamente, Stability AI e la sua Stable Diffusion sono state coinvolte in un’altra vicenda giudiziaria, instaurata presso la Corte Federale del Delaware e presso l’Alta Corte di Giustizia di Londra dalla società Getty Images, leader mondiale nella creazione e distribuzione di immagini, video e, in generale, prodotti digitali di vario tipo. Getty Images possiede propri siti web open-access contenenti una cospicua raccolta di contenuti multimediali protetti da copyright, tra cui in particolare immagini fotografiche di elevato livello artistico a cui solitamente vengono associati un titolo e una didascalia, oltre ad ulteriori metadati. Secondo Getty Images, nonostante i termini e le condizioni dei propri siti web proibiscano espressamente la riproduzione non autorizzata dei materiali ivi contenuti per finalità commerciali, Stability AI avrebbe comunque copiato senza apposita licenza oltre 10 milioni di immagini e i relativi testi e metadati associati per addestrare la propria Stable Diffusion.

L’addestramento su tali dati consente al software di imparare, tramite apprendimento automatico profondo, la relazione sussistente tra l’immagine e il relativo testo associato, e di generare quindi output quanto più possibile accurati rispetto alle richieste dell’utente. Al contempo, però, poiché le immagini di proprietà di Getty Images sono associate a didascalie molto dettagliate, addestrandosi su di esse il software molto spesso crea opere del tutto simili a quelle di Getty, di cui ne assomma le caratteristiche. Non solo, in molti casi l’output generato da Stable Diffusion riporta persino una versione modificata della filigrana recante il marchio Getty Images.

La società attrice dunque non lamenta la sola violazione dei propri diritti di copyright da parte di Stability AI, ma anche il fatto che l’output generato da Stable Diffusion creerebbe confusione sull’origine delle immagini implicando una falsa associazione tra le due società concorrenti, avvalorata anche dall’indebita riproduzione della propria filigrana.

Eccezioni al diritto d’autore: USA, UK e UE a confronto

Queste vicende, che diventeranno verosimilmente sempre più frequenti nel prossimo futuro, suggeriscono alcune considerazioni. In primo luogo, occorre rilevare che non sarà sempre agevole individuare la prova del fatto che il set di dati su cui l’IA è stata addestrata conteneva effettivamente contenuti protetti, visto che molto spesso tali set non sono liberamente accessibili.

Segue poi una ulteriore questione: le modalità di addestramento delle IA generative integrano effettivamente violazione di copyright, oppure le eccezioni al diritto d’autore previste dai diversi ordinamenti giuridici includono nella loro sfera applicativa anche l’addestramento e l’attività “creativa” dei software?

Si è osservato che le prime azioni giudiziarie contro le presunte violazioni di copyright delle IA sono state instaurate in America, ove le eccezioni al diritto d’autore sono regolate secondo la dottrina giuridica del “fair use”: le Corti, nella valutazione della asserita condotta illegittima, devono prendere in considerazione una serie di parametri quali lo scopo dell’utilizzo di opere altrui (ad esempio, se l’utilizzo avvenga per finalità di ricerca o, al contrario, per scopi commerciali), la natura dell’opera soggetta a copyright, la quantità e l’importanza della porzione sfruttata rispetto all’opera nel suo complesso, nonché l’effetto dell’utilizzo sul mercato o sul valore dell’opera originale[1].

Il fair use consente quindi ai giudici di applicare in modo flessibile le regole sul copyright e di contemperare le esigenze in gioco a seconda delle specificità del caso concreto. Ne consegue che non necessariamente l’utilizzo di un’opera altrui sarà considerato equo solo quando lo stesso avvenga per finalità non lucrative, potendo anche una finalità di tipo commerciale costituire, a seconda dei casi, un fair use[2].

In UK, l’eccezione di “fair dealing” al diritto d’autore si limita essenzialmente a consentire l’utilizzo dell’opera altrui per finalità non commerciali, ad esempio per scopi di ricerca, studio personale, critica, parodia, recensione e per riportare notizie[3]. Ha pertanto dei limiti ben più stretti e legislativamente definiti rispetto al fair use americano (verosimilmente uno dei motivi per cui Getty Images ha deciso di instaurare l’azione legale contro Stability AI anche in UK oltreché negli Stati Uniti), nonostante il governo inglese abbia recentemente proposto di estendere l’eccezione in esame ad ogni finalità.

Per quanto riguarda l’Unione Europea, la c.d. Direttiva Copyright (n. 790/2019) ha introdotto una espressa disciplina delle eccezioni al diritto d’autore per le operazioni di text e data mining (TDM), ossia quelle procedure informatiche di estrazione e rielaborazione di grandi quantità di testi/dati. In particolare, l’art. 3 della Direttiva prevede un’eccezione di TDM effettuata per finalità di ricerca scientifica da organismi di ricerca ed istituti di tutela del patrimonio culturale, mentre l’art. 4 disciplina un’eccezione di portata più generale, ai sensi della quale l’attività di TDM è consentita a qualsiasi soggetto quando non vi sia stata espressa riserva d’uso da parte del legittimo titolare. Entrambe le eccezioni sono poi accomunate dal fatto che i soggetti interessati devono aver avuto legalmente accesso agli altrui materiali coperti da tutela autorale.

La Direttiva è stata recepita in Italia con il d. lgs. n. 177/2021, che ha sostanzialmente mutuato le sopracitate previsioni negli articoli 70-ter e quater della Legge sul Diritto D’Autore[4].

Il futuro delle IA generative: questioni aperte

In questo scenario, è evidente che l’attività generativa dei sistemi di intelligenza artificiale è destinata ad incontrare ostacoli non facilmente superabili nel contesto europeo, tradizionalmente propenso a garantire ampia tutela alla personalità dell’artista e al suo diritto morale sull’opera. Solo per citarne alcuni, la previsione della ricerca scientifica (art. 3 Direttiva e art. 70-ter LDA) come sola finalità legittimante l’eccezione, o ancora la possibilità di deroga contrattuale delle operazioni di TDM a libera discrezione del titolare dei diritti (artt. 4 Direttiva e 70-quater LDA). Pertanto, future azioni legali simili a quelle sopra descritte potrebbero trovare terreno fertile in Europa, ove i titolari di diritti d’autore avrebbero interesse a sfruttarne la legislazione favorevole per ottenere una remunerazione nel caso di utilizzo di proprie opera nell’addestramento delle IA generative.

Per il futuro delle IA generative sarà quindi dirimente il modo in cui nei prossimi mesi le Corti si pronunceranno riguardo alle sopramenzionate azioni legali, posto che ne scaturiranno precedenti utili per risolvere casi analoghi che, come si è osservato, saranno sempre più frequenti. Tali decisioni avranno anche un significativo impatto sull’interpretazione di altre problematiche giuridiche che inevitabilmente sorgono con riguardo ai sistemi di intelligenza artificiale generativi, inter alia la ripartizione di responsabilità tra utilizzatori e sviluppatori per le violazioni commesse dai primi e la titolarità del diritto d’autore sulle opere create dalle IA. Occorrerà dunque attendere i prossimi sviluppi giurisprudenziali in materia, a cui, auspicabilmente, seguirà una regolamentazione più puntuale del complesso rapporto tra diritto e intelligenza artificiale.


[1] Si veda la sezione 107 del Copyright Act statunitense, che definisce il framework legislativo attraverso cui i giudici attuano l’eccezione di fair use ai diritti esclusivi.

[2] Tipicamente, lo sfruttamento di un’opera per finalità commerciali è accolto come valida eccezione ai diritti di privativa altrui nel caso in cui l’uso sia “trasformativo”, ossia aggiunge qualcosa di ulteriore all’opera stessa.

[3] Sezioni 29 e 30 del Copyright, Designs and Patents Act (1988).

[4] Legge n. 633 del 22.04.1941.