Site icon Syrus

Microsoft: l’IA che trasforma le foto in video realistici di persone che parlano e cantano

Microsoft l'IA che trasforma le foto in video realistici di persone che parlano e cantano

Negli ultimi anni, l’intelligenza artificiale (IA) ha fatto passi da gigante, portando a sviluppi rivoluzionari in diversi settori. Un recente progetto di Microsoft Research Asia ha catturato l’attenzione di molti: un nuovo strumento sperimentale di intelligenza artificiale chiamato VASA-1, in grado di trasformare fotografie statiche di persone in video realistici in cui parlano e cantano.

Tuttavia, gli stessi creatori dell’IA riconoscono il potenziale di abuso di questa tecnologia. In questo articolo esploreremo il funzionamento di VASA-1, le sue potenziali applicazioni positive e le preoccupazioni legate al suo uso improprio.

Come funziona VASA-1

VASA-1 è stato addestrato utilizzando il dataset VoxCeleb2, che contiene oltre un milione di registrazioni audio di 6.112 celebrità estratte da video di YouTube. Questo strumento di intelligenza artificiale è in grado di prendere un’immagine statica di una persona o un disegno di essa e un file audio esistente per creare un volto che sembra parlare o cantare in tempo reale. VASA-1 genera espressioni facciali, movimenti della testa e movimenti delle labbra che corrispondono al discorso o alla canzone nell’audio.

I risultati ottenuti finora sembrano abbastanza convincenti, tanto che potrebbero ingannare le persone facendole pensare che siano reali. Tuttavia, se osservati da vicino, i movimenti delle labbra e della testa possono ancora sembrare un po’ meccanici e non del tutto sincronizzati.

Potenziale abuso della tecnologia

Nonostante i risultati promettenti, è importante riconoscere il potenziale abuso di questa tecnologia. I ricercatori stessi sono consapevoli di questa possibilità e hanno deciso di non rilasciare “una demo online, API, prodotto, dettagli di implementazione aggiuntivi o offerte correlate” fino a quando non saranno sicuri che la tecnologia venga utilizzata responsabilmente e in conformità con le regole stabilite.

Tuttavia, non è chiaro se siano previste misure di sicurezza specifiche per impedire a persone malintenzionate di utilizzare questa tecnologia per scopi nefasti, come la creazione di video falsi pornografici o campagne di disinformazione.

Potenziali benefici

Nonostante le preoccupazioni, i ricercatori credono che questa tecnologia abbia molti benefici. Essa potrebbe essere utilizzata per migliorare l’equità educativa, offrendo accesso a un avatar che può comunicare per conto di persone con difficoltà di comunicazione. Inoltre, potrebbe fornire compagnia e supporto terapeutico a coloro che ne hanno bisogno, ad esempio attraverso programmi che offrono l’accesso a personaggi di intelligenza artificiale con cui le persone possono parlare.

Conclusioni

VASA-1 è un esempio affascinante dei progressi dell’intelligenza artificiale nel campo della manipolazione audiovisiva. Sebbene la tecnologia presenti potenziali rischi di abuso, i suoi utilizzi positivi potrebbero aprire nuove opportunità in vari settori.

È importante che i ricercatori e gli sviluppatori di intelligenza artificiale lavorino insieme per garantire che queste tecnologie siano utilizzate in modo etico e responsabile, tutelando la privacy e prevenendo il loro utilizzo improprio.

L’IA sta aprendo nuovi orizzonti, ma è fondamentale mantenerne un uso consapevole, affinché possa continuare a migliorare il mondo in cui viviamo.

Fonte dell’articolo qui.

Syrus

Exit mobile version