Dati addestramento IA: controversia su pagamenti e diritti
16/01/2024
L’utilizzo dei dati di addestramento riveste un ruolo fondamentale nell’Intelligenza Artificiale generativa. Tuttavia, la questione se le aziende di IA debbano pagare per l’accesso a tali dati è oggetto di un acceso dibattito. Recentemente, sono state sollevate una serie di cause legali contro giganti tecnologici come Meta, Google e OpenAI al riguardo. A Washington, DC, sembra esserci un consenso crescente tra i legislatori sul fatto che le grandi aziende tecnologiche debbano pagare i media per l’utilizzo dei loro contenuti nei progetti di IA.
L’accordo bipartizan sulla questione dei pagamenti
Durante un’audizione al Senato sugli effetti dell’IA sul giornalismo, i legislatori di entrambi gli schieramenti politici hanno concordato sul fatto che OpenAI e altre aziende dovrebbero pagare i media per l’utilizzo dei loro contenuti nei progetti di IA. Richard Blumenthal, il democratico che presiede la Sottocommissione Giudiziaria sulla Privacy, la Tecnologia e la Legge che ha organizzato l’audizione, ha dichiarato: “Non è solo giusto dal punto di vista morale, ma è anche una necessità legale.” Anche Josh Hawley, un repubblicano che sta collaborando con Blumenthal per la legislazione sull’IA, ha concordato, affermando: “Non dovrebbe essere il caso che solo perché le più grandi aziende del mondo vogliono accaparrarsi i tuoi dati, possano farlo.”
L’impatto dell’utilizzo dei contenuti giornalistici
I leader dell’industria dei media presenti all’audizione hanno descritto come le aziende di IA mettano in pericolo il settore utilizzando i loro contenuti senza compensazione. Curtis LeGeyt, CEO dell’Associazione Nazionale dei Radiodiffusori, Danielle Coffey, CEO dell’Alleanza dei Media di Notizie, e Roger Lynch, CEO di Condé Nast, hanno tutti sostenuto l’idea di richiedere una licenza per l’utilizzo dei contenuti. Coffey ha affermato che le aziende di IA “distruggono la qualità dei contenuti di cui si nutrono“, mentre Lynch ha caratterizzato i dati di addestramento ottenuti senza permesso come “merce rubata“. Entrambi hanno sostenuto che le aziende di IA violano il diritto d’autore secondo la legge attuale. Lynch ha esortato i legislatori a specificare che l’utilizzo di contenuti giornalistici senza aver prima stipulato accordi di licenza non è protetto dal fair use, un principio giuridico che consente violazioni del copyright in determinate condizioni.
Un terreno comune
Le audizioni al Senato possono spesso essere avverse, ma in questa occasione l’atmosfera è stata in gran parte cordiale. I legislatori e gli addetti ai lavori dell’industria dei media hanno spesso applaudito le dichiarazioni reciproche. “Se il Congresso potesse chiarire che l’utilizzo dei nostri contenuti, o di altri contenuti editoriali, per l’addestramento e l’output dei modelli IA non costituisce fair use, allora il libero mercato si occuperà del resto“, ha affermato Lynch a un certo punto. “Mi sembra estremamente ragionevole,” ha risposto Hawley.
Il professor di giornalismo Jeff Jarvis è stato l’unico a dissentire durante l’audizione. Ha affermato che l’addestramento su dati ottenuti senza pagamento rientra effettivamente nel fair use e si è opposto alla concessione di licenze obbligatorie, sostenendo che ciò danneggerebbe l’ecosistema delle informazioni anziché proteggerlo. “Devo dire che mi sento offeso nel vedere gli editori fare lobby per una legislazione protezionistica, sfruttando il capitale politico guadagnato attraverso il giornalismo“, ha detto, criticando gli altri relatori. (Jarvis è stato anche oggetto delle uniche domande conflittuali durante l’audizione, poste dalla repubblicana Marsha Blackburn, che ha interrogato Jarvis sulla presunta parzialità dell’IA nei confronti dei conservatori e ha recitato una poesia generata dall’IA che esaltava il presidente Biden come prova.)
Al di fuori della sala del comitato
Al di fuori della sala del comitato, non c’è un consenso così netto sulla necessità di una licenza obbligatoria. OpenAI e altre aziende di IA hanno sostenuto che non è fattibile ottenere una licenza per tutti i dati di addestramento, e alcuni esperti indipendenti di IA concordano su questa posizione.
L’uso dei dati di addestramento nell’IA è un argomento complesso e dibattuto. Mentre alcuni ritengono che le aziende di IA debbano pagare per l’utilizzo dei contenuti dei media, altri sostengono che questo potrebbe essere dannoso per l’ecosistema delle informazioni. È necessario trovare un equilibrio tra il rispetto dei diritti dei media e l’innovazione nell’IA.