Per l'AI generativa servono regole sulla trasparenza e l'addestramento dei sistemi

15 novembre 2023

In questi giorni in Europa il Parlamento, Consiglio e Commissione stanno negoziando il testo finale dell’Artificial Intelligence Act, uno strumento essenziale per lo sviluppo delle nuove tecnologie legate all’AI generativa che avrà effetti sul futuro di tutti noi.

Per il settore musicale la questione è di grande interesse perché molte di queste tecnologie sono già impiegate da case discografiche ed artisti nella produzione creativa. L’evoluzione delle tecnologie digitali ha guidato la trasformazione del mercato musicale negli ultimi dieci anni e le potenzialità dell’intelligenza artificiale sono sotto gli occhi di tutti. Ciò che in questa fase può generare criticità è l’assenza di regole certe sull’utilizzo di contenuti creativi nell’ambito dell’addestramento delle piattaforme come OpenAI e altre.

I modelli di intelligenza artificiale generativa sono una forma distinta di algoritmo di apprendimento automatico programmato per uno scopo specifico: produrre output (quando richiesto) sulla base di lavori preesistenti che vengono acquisiti dal sistema. L'intelligenza artificiale generativa è diversa da quella tradizionale (a volte chiamata analitica) L'intelligenza artificiale generativa assorbe lavori creativi per produrre nuovo materiale, mentre l'intelligenza artificiale tradizionale viene utilizzata per svolgere compiti e calcoli più meccanici o automatici come rilevare modelli, affinare l'analisi o classificare i dati.

L'output dei modelli generativi potrebbe essere testo, immagini, materiale audio o audiovisivo, che il modello AI in genere produce solo dopo aver importato simili opere protette da copyright.

Queste attività della "fase di importazione" includono la raccolta (che include lo scraping) e la curatela di opere protette da copyright a fini di formazione, indipendentemente dal fatto che l'entità impegnata in tali atti sia la stessa entità che possiede o gestisce il sistema di intelligenza artificiale generativa che importa queste opere.

Con la proposta di regolamento sull’Intelligenza Artificiale (Artificial Intelligence Act), l’Unione europea ha l’opportunità unica di assumere un ruolo guida a livello globale nella creazione di un quadro trasparente ed efficace per l’AI, ma è opportuno definire con certezza alcune caratteristiche alla quali si dovranno conformare le piattaforme. Questo prescinde ovviamente dal tema dei contenuti creativi. La trasparenza delle piattaforme riguarda diritti fondamentali dei cittadini.

Nel settore dell’industria creativa la capacità dei modelli di intelligenza artificiale generativa di assimilare, copiare e appropriarsi di contenuti protetti solleva nuove questioni per i titolari dei diritti.

Questo tema fondamentale potrebbe trovare facilmente una soluzione se i soggetti centrali nella filiera dell'intelligenza artificiale generativa (ossia gli sviluppatori e gli operatori dei sistemi e dei modelli di intelligenza artificiale, compresi i modelli di base) fossero tenuti a conformarsi ai principi fondamentali di governance dei dati. Il primo è più importante aspetto è che le piattaforme dovrebbero conservare e rendere pubblicamente disponibili informazioni sufficientemente dettagliate sull'uso dei dati di addestramento e di altri materiali o contenuti protetti dal diritto d'autore, al fine di consentire alle parti con un interesse legittimo, come i titolari dei diritti d'autore, di determinare in via preliminare se e come i loro diritti siano stati lesi e, in seconda istanza, coloro che hanno interessi legittimi dovrebbero essere in grado di richiedere e ricevere registrazioni complete dei dati di addestramento, comprese opere o altri materiali protetti. Questo sistema a due livelli garantirebbe che le parti interessate possano far valere i propri diritti, tutelando nello stesso istante sia sviluppatori che gli operatori di sistemi e modelli di AI (compresi i modelli di base) da richieste strumentali da parte di soggetti senza interessi legittimi da parte dei concorrenti. In Europa questo sarebbe coerente con la direttiva sul diritto d’autore e con le previsioni in merito al cosiddetto “text and data mining”.

Questo obbligo di conservazione delle registrazioni accurate dei dati dovrebbe essere posto in capo allo sviluppatore del modello di base e continuare a essere applicato alle entità che nel corso della filiera forniscono tale modello, questo per garantire che l'obbligo non possa essere facilmente aggirato. Inoltre, per evitare il "riciclaggio di intelligenza artificiale", è fondamentale che tale obbligo si estenda a tutti i sistemi resi disponibili nell'UE o che generano output utilizzati nell'UE, indipendentemente dalla giurisdizione in cui potrebbe essere avvenuto lo sviluppo (incluso il pre-addestramento, l'addestramento, il raffinamento, la convalida, i test, l'adattamento di un sistema di intelligenza artificiale pre-addestrato o la generazione degli output). Ciò anche per garantire che contenuti illeciti, generati da modelli di base addestrati fuori dall’UE, non possano essere resi disponibili all’interno dell’UE.

Il tema della trasparenza è un aspetto fondamentale e il Parlamento EU ha emendato il testo secondo queste previsioni che prevedono la conservazione e l’obbligo di rendere pubbliche le informazioni sull’addestramento. Questo non significa bloccare l’innovazione come qualcuno ha osservato ma al contrario consentire lo sviluppo di un contesto innovativo che tuteli tutti i soggetti coinvolti nella rivoluzione dell’AI.

L’Italia, che avrà l’onore ma anche l’onere di gestire il prossimo G7 dove l’intelligenza artificiale costituirà uno degli argomenti centrali, ha davanti a se l’occasione di intervenire sia nel contesto del Consiglio EU sostenendo il testo approvato al Parlamento europeo, sia indirizzando l’agenda globale futura con una proposta di regole chiare sulla trasparenza e la protezione dei dati.