TECNOLOGIA, INTERNET TRENDS, GAMING, BIG DATA

Google lancia Imagen 2 per video dinamici e creatività aziendale

Google lancia Imagen 2 per video dinamici e creatività aziendale

By auroraoddi

Google ha annunciato il rilascio di Imagen 2, una nuova versione del suo generatore di video clip. Questo strumento, disponibile all’interno della piattaforma di sviluppo Vertex AI, offre funzionalità avanzate per la creazione e l’editing di immagini e video a partire da prompt testuali. Imagen 2 è stato presentato durante la conferenza annuale Google Cloud Next a Las Vegas.

Caratteristiche di Imagen 2

Imagen 2 è una famiglia di modelli di intelligenza artificiale lanciata da Google nel dicembre 2023. Questi modelli sono in grado di creare e modificare immagini a partire da prompt testuali, similmente a DALL-E di OpenAI e Midjourney. Tuttavia, Imagen 2 offre funzionalità specifiche per il settore aziendale. Ad esempio, può renderizzare testi, emblemi e loghi in diverse lingue e sovrapporli a immagini esistenti, come biglietti da visita, abbigliamento e prodotti.

Nuove funzionalità di Imagen 2

Dopo una fase di anteprima, l’editing delle immagini con Imagen 2 è ora disponibile in Vertex AI, insieme a due nuove funzionalità: inpainting e outpainting. Queste funzioni consentono di rimuovere parti indesiderate da un’immagine, aggiungere nuovi elementi e espandere i bordi per ottenere un campo visivo più ampio.

Tuttavia, la vera novità di Imagen 2 è la generazione di video a partire da prompt testuali. Ora è possibile creare brevi video di quattro secondi utilizzando Imagen 2, simili ad altri strumenti di generazione di clip basati su intelligenza artificiale come Runway, Pika e Irreverent Labs. Google promuove l’uso di live images come strumento per marketer e creativi, ad esempio come generatore di GIF per annunci pubblicitari su natura, cibo e animali.

Limitazioni attuali

Tuttavia, le live images generate da Imagen 2 sono attualmente a bassa risoluzione, con una dimensione di 360 pixel per 640 pixel. Google assicura che la risoluzione migliorerà in futuro. Inoltre, per evitare la creazione di deepfake, Google utilizza la tecnologia SynthID sviluppata da Google DeepMind per applicare watermark invisibili e crittografici alle live images.

Google sostiene che questi watermark sono resistenti a modifiche, compressione, filtro e regolazione del tono del colore, ma solo gli strumenti forniti da Google possono rilevare tali watermark. Inoltre, Google afferma che le live images sono “filtrate per la sicurezza”. Nonostante queste assicurazioni, l’efficacia delle tecnologie di watermarking e filtraggio rimane da verificare, soprattutto considerando la storia di Google con Gemini, il suo chatbot basato su intelligenza artificiale, che ha generato immagini offensive e inaccurazioni.

Confronto con altri strumenti di generazione video

Sebbene Imagen 2 offra funzionalità interessanti, come la generazione di video a partire da prompt testuali, è importante sottolineare che esistono già altri strumenti sul mercato che offrono clip di maggiore durata e risoluzione. Ad esempio, Runway è in grado di generare clip di 18 secondi a risoluzioni molto più elevate. Inoltre, altri strumenti come Stable Video Diffusion di Stability AI offrono maggiore personalizzazione in termini di frame rate.

Un altro concorrente interessante è Sora di OpenAI, che offre una fotorealismo notevole. Pertanto, nonostante le potenzialità di Imagen 2, sembra che ci siano già strumenti più avanzati sul mercato.

Scopri di più da Syrus

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continua a leggere