TECNOLOGIA, INTERNET TRENDS, GAMING, BIG DATA

Tumblr e WordPress: i dati degli utenti per l’addestramento dei modelli AI

Tumblr e WordPress: i dati degli utenti per l’addestramento dei modelli AI

By auroraoddi

Nell’era dell’intelligenza artificiale, sempre più aziende cercano di utilizzare dati utente per addestrare i propri modelli AI. In questo contesto, è emersa la notizia che Tumblr e WordPress, tramite la loro casa madre Automattic, stanno negoziando accordi per vendere dati utente ad aziende come OpenAI e Midjourney. Secondo un report di 404 Media, Automattic sarebbe vicina a completare l’accordo per fornire dati utili all’addestramento dei modelli AI di queste aziende.

I dati coinvolti

Non è ancora chiaro quali dati saranno inclusi in questi accordi, ma sembra che Automattic abbia inizialmente incluso dati sensibili che non avrebbero dovuto far parte del pacchetto. Secondo un post interno di Cyle Gage, product manager di Tumblr, Automattic avrebbe incluso post privati su blog pubblici, blog cancellati o sospesi, domande senza risposta (quindi non pubblicate pubblicamente), risposte private, post contrassegnati come espliciti e contenuti provenienti da blog partner premium (come il vecchio sito musicale di Apple).

Retrattazione e azioni correttive

Tuttavia, Automattic sembra aver preso provvedimenti per risolvere il problema. L’azienda ha dichiarato che condividerà solo contenuti pubblici ospitati su WordPress.com e Tumblr da siti che non hanno scelto di escludersi. Automattic ha anche pianificato di aggiornare regolarmente i partner sull’opzione di esclusione degli utenti e chiederà la rimozione dei loro contenuti dalle fonti passate e future. Allo stesso tempo, Automattic sta sviluppando un nuovo strumento di opt-out che consentirà agli utenti di bloccare l’accesso dei crawler AI ai loro contenuti.

Il coinvolgimento delle aziende AI

Le aziende AI coinvolte, OpenAI e Midjourney, possono beneficiare di questi accordi per addestrare i propri modelli AI con una vasta quantità di dati utente. OpenAI, in particolare, ha lanciato un programma di partnership per raccogliere set di dati da terze parti al fine di migliorare i propri modelli AI. Questo tipo di accordi di addestramento AI sta diventando un’opportunità redditizia per molte aziende che operano nel settore online.

Implicazioni per la privacy degli utenti

Mentre Automattic afferma che rispetterà le preferenze di opt-out degli utenti, non esistono regolamentazioni legali che richiedano alle aziende AI di rispettare tali preferenze. Pertanto, l’utente medio potrebbe essere preoccupato per la privacy delle proprie informazioni personali. Tuttavia, Automattic sembra impegnata a garantire che i propri accordi con le aziende AI rispettino le preferenze degli utenti in materia di attribuzione, opt-out e controllo.

Scopri di più da Syrus

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continua a leggere