TECNOLOGIA, INTERNET TRENDS, GAMING, BIG DATA

OpenAI lancia Voice Engine per clonare la voce in 15 secondi

OpenAI lancia Voice Engine per clonare la voce in 15 secondi

By auroraoddi

OpenAI ha recentemente annunciato un nuovo strumento rivoluzionario chiamato Voice Engine. Questa tecnologia di clonazione della voce è in grado di imitare qualsiasi speaker analizzando un campione audio di soli 15 secondi. Secondo OpenAI, questo strumento genera un discorso “naturale” con voci “emotive e realistiche“.

La tecnologia di Voice Engine è basata sull’API di text-to-speech già esistente dell’azienda, ed è stata sviluppata a partire dal 2022. OpenAI ha già utilizzato una versione di questo strumento per alimentare le voci preimpostate disponibili nell’attuale API di text-to-speech e nella funzione Read Aloud. Sono disponibili diversi esempi sul blog ufficiale dell’azienda e il risultato è sorprendentemente simile alla voce reale. Immaginate le potenzialità, sia positive che negative, di questa tecnologia.

Voice Engine, come funziona

OpenAI ritiene che questa tecnologia possa essere utile per diverse applicazioni, tra cui l’assistenza alla lettura, la traduzione linguistica e l’aiuto alle persone affette da disturbi del linguaggio improvvisi o degenerativi. A tal proposito, l’azienda ha citato un programma pilota presso la Brown University in cui è stata creata una clonazione di Voice Engine a partire da registrazioni audio effettuate per un progetto scolastico, al fine di aiutare un paziente con problemi di disturbo del linguaggio.

Tuttavia, nonostante i benefici potenziali, questa tecnologia potrebbe essere utilizzata in modo improprio da malintenzionati per creare deepfake e truffe. OpenAI è consapevole di questi rischi e ha dichiarato che prima di lanciare ufficialmente il prodotto, sta lavorando a stretto contatto con partner statunitensi e internazionali provenienti da governo, media, intrattenimento, istruzione e società civile per garantire un utilizzo responsabile e sicuro. I tester della versione di anteprima hanno accettato le politiche di utilizzo di OpenAI, che vietano l’impersonificazione di un’altra persona senza consenso o diritto legale.

Preoccupazioni sulla privacy

Una delle principali preoccupazioni riguardo a Voice Engine riguarda la privacy. OpenAI riconosce questo problema e sta lavorando per soddisfare rigorosi requisiti di privacy prima di un lancio completo. L’azienda ha dichiarato che sono stati implementati misure di sicurezza come il watermarking per tracciare l’origine di qualsiasi audio generato dall’IA e il “monitoraggio proattivo” del modo in cui il sistema viene utilizzato. Inoltre, quando il prodotto verrà lanciato ufficialmente, ci sarà una “lista di voci non ammesse” che rileverà e impedirà l’utilizzo di speaker generati dall’IA troppo simili a personaggi famosi.

Prezzo e disponibilità

OpenAI non ha ancora annunciato una data precisa per il lancio ufficiale di Voice Engine, ma ha condiviso alcune informazioni sul possibile prezzo. Secondo quanto riportato da TechCrunch, il costo potrebbe essere di $15 per un milione di caratteri, che corrisponde approssimativamente a 162.500 parole, ovvero la lunghezza di “The Shining” di Stephen King. Inoltre, OpenAI ha menzionato anche una versione “HD” che costerà il doppio, ma non ha fornito ulteriori dettagli su come funzionerà questa opzione.

Scopri di più da Syrus

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continua a leggere