OpenAI e Google sotto accusa per l’uso di YouTube per l’addestramento dell’IA
10/04/2024
Negli ultimi anni, l’intelligenza artificiale ha fatto passi da gigante nel campo della ricerca e dell’innovazione. Aziende come OpenAI e Google si sono impegnate a sviluppare modelli di IA sempre più avanzati per migliorare i loro prodotti e servizi. Tuttavia, di recente sono emerse alcune preoccupazioni riguardo all’uso di dati protetti da copyright, in particolare per quanto riguarda l’utilizzo delle trascrizioni dei video di YouTube per addestrare i modelli di IA.
OpenAI e l’utilizzo delle trascrizioni dei video di YouTube
Secondo un rapporto del New York Times, OpenAI avrebbe utilizzato il suo strumento di riconoscimento vocale chiamato Whisper per trascrivere oltre un milione di ore di video di YouTube. Queste trascrizioni sarebbero state poi utilizzate per addestrare GPT-4. L’utilizzo di video di YouTube per addestrare modelli di IA solleva preoccupazioni riguardo al rispetto dei diritti d’autore dei creatori di contenuti.
Information aveva precedentemente segnalato che OpenAI aveva utilizzato video di YouTube e podcast per addestrare i suoi modelli di IA. Il presidente di OpenAI, Greg Brockman, sembra essere stato coinvolto personalmente in queste attività. Tuttavia, Google ha dichiarato di non essere a conoscenza dell’utilizzo di video di YouTube da parte di OpenAI e che il “raschiamento” o il download non autorizzato di contenuti di YouTube non è consentito secondo le regole dell’azienda.
Google e la sua politica sulla privacy
Secondo il rapporto del New York Times, Google avrebbe apportato modifiche alla sua politica sulla privacy nel giugno 2023 per coprire più ampiamente l’utilizzo di contenuti pubblicamente disponibili, tra cui Google Docs e Google fogli, per addestrare i suoi modelli di IA e i suoi prodotti. Tuttavia, Google ha dichiarato che tali dati vengono utilizzati solo con il consenso degli utenti che partecipano ai test delle sue funzionalità sperimentali. L’azienda ha anche affermato che non ha iniziato ad addestrare i suoi modelli di IA su nuovi tipi di dati a seguito di tali modifiche alla politica sulla privacy.
Violazione dei diritti d’autore dei creatori di contenuti
L’utilizzo delle trascrizioni dei video di YouTube da parte di OpenAI e Google suscita preoccupazioni legate alla violazione dei diritti d’autore dei creatori di contenuti. Secondo il rapporto del New York Times, molte delle persone coinvolte nelle attività di addestramento dei modelli di IA erano a conoscenza di questa pratica, ma non hanno intrapreso alcuna azione contro OpenAI perché anche Google stava utilizzando video di YouTube per addestrare i suoi modelli di IA. Tuttavia, Google ha affermato che utilizza tali video solo con il consenso dei creatori di contenuti che hanno acconsentito a tale utilizzo.