Fuori i taccuini! È un attacco in grande stile quello che i legali di OpenAI hanno sferrato contro il New York Times. Il più grande quotidiano al mondo, nel dicembre 2023, insoddisfatto della contropartita economica proposta, ha denunciato l’azienda madre di ChatGPT per aver addestrato la propria “creatura” tecnologica con milioni di contenuti degli archivi digitali del giornale, senza rispetto del copyright e dei diritti d’autore. Dopo una fase di stallo del procedimento, nei mesi scorsi OpenAI ha impostato la propria linea difensiva, in primo luogo reclamando l’attestato di originalità dei contenuti del New York Times. Da qui la richiesta di presentare alla Corte i taccuini dei cronisti con gli appunti originali poi tradotti in articoli. Chi ci dice, pare di essere il ragionamento dei legali, che quell’articolo sia un frutto esclusivo del lavoro di un cronista? E se anche lui, invece, avesse pescato a piene mani in fonti già note?

I legali del New York Times, dopo essersi fatti una sonora risata rispetto ad una richiesta quantomeno singolare perché andrebbe a ledere anche le tutele etiche della professione di giornalista, hanno cominciato a ragionare sulle motivazioni di quella pretesa, concludendo che potrebbe semplicemente trattarsi di un escamotage tattico per far lievitare le spese legali e prendere tempo.

Nella lettera inviata al giudice, Open AI tenta di delimitare gli ambiti di ogni articolo protetti dal copyright, limitandoli “solo a quei componenti di un’opera che sono originali dell’autore”, sottolineando che il quotidiano “non può avanzare una richiesta di risarcimento per violazione” anche su quelle parti dell’articolo caratterizzate da citazioni di terzi o da comunicati stampa. Da qui la richiesta dei taccuini con gli appunti originali.

L’opposizione del New York Times si basa su un concetto di fondo: “I processi di raccolta delle notizie sono irrilevanti ai fini delle tutela che deriva dal copyright”.

Anche se un articolo fosse frutto al 90% di contenuti di terzi, secondo i legali del NYT sarebbe comunque protetto dal diritto d’autore. Causa dunque più che motivata, secondo i legali del quotidiano, vista la mole enorme di materiale depositato che si configura come un vero e proprio copia e incolla di articoli del giornale.

Ma i legali di OpenAI seguono anche un’altra pista: con un documento di 35 pagine presentato da mesi alla Corte Distrettuale, sostengono che quei testi di Chat GPT “copia e incollati” appaiono come clonati dal New York Times perché il risultato di quesiti creati ad arte per ingannare il prodotto di OpenAI. In modo molto aggressivo, alla pagina 11 del documento sottoposto alla Corte, i legali del colosso di AI affermano addirittura: “La verità, che emergerà nel corso di questa causa, è che il Times ha pagato qualcuno per hackerare i prodotti di OpenAI. Ci sono volute decine di migliaia di tentativi per generare i risultati altamente anomali che costituiscono l’Allegato J della denuncia. Sono stati in grado di farlo solo sfruttando un bug (che OpenAI si è impegnata a correggere) utilizzando ingannevoli che violano palesemente le condizioni d’uso di OpenAI. E anche in questo caso, hanno dovuto dare in pasto allo strumento porzioni degli stessi articoli di cui volevano ricavare i passaggi testuali, praticamente tutti già presenti su più siti web pubblici. Le persone normali non usano i prodotti di OpenAI in questo modo”.

I legali del Times hanno reagito con veemenza respingendo l’accusa di hacking: “L’affermazione di OpenAI, che attira l’attenzione, secondo la quale il Times avrebbe “hackerato” i suoi prodotti – si legge nel documento prodotto davanti alla Corte – è tanto irrilevante quanto falsa. Come chiarisce l’Allegato J alla denuncia, il Times ha esempi di memorizzazione chiedendo al GPT-4 le prime parole o frasi degli articoli del Times. Questo lavoro è stato necessario solo perché OpenAI non divulga i contenuti che utilizza per addestrare i suoi modelli e alimentare i suoi prodotti rivolti all’utente”.

A distanza di mesi da questo affondo e parata, il clima in cui si articola la causa resta comunque pesante. Il braccio di ferro tra il New York Times e OpenAI è destinato a produrre effetti a livello planetario, anche se la tematica non è così univoca: “La difesa del copyright può ostacolare il diritto di accesso al sapere” ha scritto Michele Mezza, tra i massimi esperti italiani di cultura digitale. Aggiungendo, però, l’esigenza di una sorta di patto di reciprocità: “Il diritto ad usufruire di contenuti abbondanti e accessibili rivendicato dai grandi centri tecnologici – scrive Mezza su Strisciarossa.it – deve essere applicato agli stessi centri che devono rendere le proprie piattaforme di intelligenza artificiale, i propri data base di profilazione, i propri software di editing automatico condivisibili e riprogrammabili da ogni utente. Il punto di attacco non è quello di recintare i propri contenuti – sottolinea Mezza – ma di imporre una piena reciprocità che permetta ad ogni figura professionale – giornalisti, medici, giuristi, pubblica amministrazione – di costruire propri sistemi di relazione e professionalità digitale senza dover sottostare alle gabelle di proprietari monopolisti”.

Di valenza più strettamente giuridica l’opinione dell’avvocato Deborah Bianchi, specializzata in diritto dell’Internet dal 2006. È autore di alcuni libri tra cui “Internet e il danno alla persona” (Giappichelli); “Danno e Internet” (Il Sole 24 Ore). Bianchi è anche tra gli autori del Report 2024 dell’Osservatorio sul Giornalismo Digitale dell’Ordine Nazionale del Giornalisti, dove ha scritto un saggio proprio sugli aspetti normativi: “Copyright e diritti di autore sono un ambito fortemente colpito dall’impatto dei GenAI sul mondo del giornalismo – sottolinea – La violazione dei diritti di autore in ambito di giornalismo e intelligenza artificiale si può inquadrare sotto due profili: il profilo degli outputs rivelatori di addestramento su contenuti riservati e il profilo dell’attribuzione dell’autorialità (alla macchina o all’uomo?)”.

Ma in un caso come quello tra New York Times e OpenAI è così pacifico il riconoscimento del plagio attraverso una sorta di copia e incolla da parte di ChatGPT?

“Sul tema della violazione dei diritti di autore dei contenuti di addestramento – risponde Bianchi – sta risultando di difficile prova la somiglianza tra l’output e i contenuti autoriali originari. Pertanto, le ultime cause depositate da dei giornali americani puntano su un aspetto diverso dall’analogia tra output e contenuto originario. Ora si fonda la citazione sulla violazione dei DRM (Digital Right Management) apposti sul contenuto. In Cina invece sono molto più tranchant e nella prima sentenza in materia è stato condannato il responsabile del sito web in cui era integrato un modello GenAI per fare disegni (caso “GenAI disegna Ultraman”)”.

I passi da gigante sul fronte dell’AI generativa ci porteranno anche a dover prendere in considerazione il diritto d’autore della macchina?

“In merito alla possibilità di riconoscere in capo a un modello GenAI la titolarità del diritto di autore – risponde Bianchi – attualmente tutti i sistemi giuridici sono di avviso negativo. In particolare, si riporta il caso di una persona che aveva tentato di iscrivere all’Ufficio Copyright statunitense un’immagine eseguita quasi interamente da un modello intelligente e che, incassato il rifiuto dell’ente, ha attivato la causa presso il Tribunale del Distretto di Columbia (18.08.2023), che parimenti ha confermato il diniego dell’Ufficio Copyright sostenendo che l’”Autorialità umana” è il “requisito fondamentale del diritto d’autore “.

Più in generale, avvocato Bianchi, quale è il suo parere sullo stato attuale della regolamentazione dell’Intelligenza Artificiale, a livello globale?

“Stati Uniti, Europa, Cina affrontano in modo differente l’impatto delle varie forme di Intelligenza Artificiale: un approccio di deregulation negli USA, uno di regolamentazione in UE, uno dirigistico in Cina. Ciascun sistema presenta pregi e difetti. In particolare, gli esperti del settore tecnologico hanno espresso perplessità per i sistemi a forte vocazione regolamentale perché l’eccessiva regolamentazione potrebbe imporre oneri burocratici e costi aggiuntivi tali da frenare la ricerca e lo sviluppo, causando la fuga dei talenti e degli investimenti”.