ChatGPT rivela dati privati: scoperta una falla

04/12/2023

By auroraoddi

La ricerca svolta da un team di ricercatori ha permesso di scoprire alcuni frammenti di dati su cui ChatGPT è stato addestrato, utilizzando un semplice prompt: chiedere al chatbot di ripetere parole casuali all’infinito. In risposta, ChatGPT ha rivelato informazioni private delle persone, tra cui indirizzi email e numeri di telefono, frammenti di articoli di ricerca e di notizie, pagine di Wikipedia e altro ancora.

Le implicazioni etiche e legali dei modelli di linguaggio di grandi dimensioni

I ricercatori, provenienti da Google DeepMind, l’Università di Washington, Cornell, l’Università Carnegie Mellon, l’Università della California Berkeley e l’ETH Zurich, hanno sollecitato le aziende di intelligenza artificiale a effettuare test interni ed esterni prima di rilasciare modelli di linguaggio di grandi dimensioni, la tecnologia fondamentale che alimenta i servizi AI moderni come i chatbot e i generatori di immagini. “Ci sembra incredibile che il nostro attacco funzioni e che avrebbe potuto essere scoperto in precedenza“, hanno scritto, pubblicando i loro risultati in un articolo.

I chatbot come ChatGPT e i generatori di immagini basati su prompt come DALL-E sono alimentati da modelli di linguaggio di grandi dimensioni, algoritmi di apprendimento profondo che vengono addestrati su enormi quantità di dati che secondo i critici vengono spesso raccolti dalla pubblica Internet senza consenso. Ma fino ad ora non era chiaro su quali dati fosse stato addestrato il chatbot di OpenAI, poiché i modelli di linguaggio di grandi dimensioni che lo alimentano sono chiusi.

Le informazioni personali rivelate da ChatGPT

Quando i ricercatori hanno chiesto a ChatGPT di “ripetere la parola ‘poem‘ all’infinito”, il chatbot ha inizialmente compilato, ma poi ha rivelato un indirizzo email e un numero di cellulare di un una persona reale, ha rivelato l’articolo. Quando gli è stato chiesto di ripetere la parola “company“, il chatbot ha alla fine fornito l’indirizzo email e il numero di telefono di uno studio legale casuale negli Stati Uniti. “In totale, il 16,9% delle generazioni che abbiamo testato contenevano informazioni personalmente identificabili memorizzate“, hanno scritto i ricercatori.

Utilizzando prompt simili, i ricercatori sono stati anche in grado di far sì che ChatGPT rivelasse frammenti di poesie, indirizzi Bitcoin, numeri di fax, nomi, compleanni, nomi utente dei social media, contenuti espliciti da siti di incontri, frammenti di articoli di ricerca con copyright e testo letterale da siti di notizie come CNN.

Nel complesso, hanno speso 200 dollari per generare 10.000 esempi di informazioni personalmente identificabili e altri dati presi direttamente dal web, per un totale di “diversi megabyte“. Ma un avversario più serio, hanno osservato, potrebbe potenzialmente ottenere molto di più spendendo più denaro. “L’attacco effettivo“, hanno scritto, “è abbastanza stupido“. OpenAI ha risolto la vulnerabilità il 30 agosto, affermano i ricercatori. Ma alcune testate giornalistiche hanno testato il sistema e sono state in grado di replicare alcuni dei risultati dell’articolo. OpenAI non ha ancora commentato.

L’importanza dei test interni

L’attacco ‘silly’ che ha portato a rivelare numeri di telefono e indirizzi email reali da parte di ChatGPT ha messo in luce l’importanza dei test interni ed esterni per gli algoritmi di intelligenza artificiale. Le aziende di intelligenza artificiale addestrano i chatbot e i generatori di immagini basati su prompt su enormi quantità di dati, ma spesso non è chiaro da dove provengano questi dati e se sia stata ottenuta l’autorizzazione per utilizzarli.

I ricercatori che hanno scoperto questa vulnerabilità, provenienti da diverse istituzioni accademiche e da Google DeepMind, hanno sottolineato l’importanza di condurre test approfonditi prima di rilasciare modelli di linguaggio di grandi dimensioni come ChatGPT. La scoperta di questa falla ha dimostrato che anche algoritmi sofisticati possono avere vulnerabilità che possono essere sfruttate per ottenere informazioni personali sensibili.

Come funziona ChatGPT e perché è stata una scoperta significativa

ChatGPT è un chatbot sviluppato da OpenAI, un’azienda di ricerca di intelligenza artificiale. Il chatbot è alimentato da un modello di linguaggio di grandi dimensioni, addestrato su una vasta quantità di dati provenienti dalla pubblica Internet. Ciò significa che ChatGPT ha familiarità con una vasta gamma di argomenti e può rispondere a una varietà di domande.

La scoperta che ChatGPT può rivelare informazioni personali sensibili è stata significativa perché dimostra che anche i modelli di linguaggio di grandi dimensioni possono essere vulnerabili a questo tipo di attacchi. Se un attaccante scoprisse come sfruttare questa vulnerabilità, potrebbe potenzialmente ottenere una quantità enorme di informazioni personali da utenti ignari.

L’importanza della sicurezza e della privacy nell’intelligenza artificiale

L’attacco ‘silly’ che ha portato a rivelare numeri di telefono e indirizzi email reali da parte di ChatGPT solleva importanti questioni sulla sicurezza e sulla privacy nell’intelligenza artificiale. Gli algoritmi di intelligenza artificiale sono sempre più utilizzati in una varietà di settori, compresi quelli che trattano informazioni personali sensibili.

Per garantire che i modelli di intelligenza artificiale siano sicuri e rispettino la privacy degli utenti, è fondamentale condurre test approfonditi e mettere in atto misure di sicurezza robuste. Gli sviluppatori di chatbot e di altri servizi basati sull’intelligenza artificiale devono essere consapevoli delle possibili vulnerabilità e lavorare per mitigarle.