TECNOLOGIA, INTERNET TRENDS, GAMING, BIG DATA

Stable Diffusion 3 rivoluziona l’elaborazione immagini AI

Stable Diffusion 3 rivoluziona l’elaborazione immagini AI

By auroraoddi

Stability AI ha annunciato il lancio di Stable Diffusion 3 (SD3), la versione più recente e potente del suo modello di generazione di immagini basato sull’AI. Questo nuovo progresso nel campo dell’AI mira a consolidare il vantaggio acquisito da Stability AI rispetto ai suoi concorrenti, tra cui Sora e Gemini, sviluppati rispettivamente da OpenAI e Google.

Un’architettura innovativa per una maggiore potenza

SD3 rappresenta un notevole passo avanti nel campo dell’elaborazione delle immagini basata sull’AI grazie alla sua architettura innovativa. L’azienda ha basato questo nuovo modello su un “diffusion transformer” aggiornato, una tecnica che è stata pionieristica nel 2022 e successivamente rivista nel 2023 per raggiungere una maggiore scalabilità. Questo nuovo approccio consente a SD3 di generare immagini con una qualità superiore rispetto alle versioni precedenti del modello Stable Diffusion.

Una gamma di modelli con diversi parametri

La suite di modelli SD3 comprende un’ampia gamma di opzioni con differenti parametri, che vanno dai 800 milioni di parametri della versione entry-level (SD 1.5) agli 8 miliardi di parametri della versione più potente (SD XL). Questa varietà di opzioni consente agli utenti di adattare il modello alle proprie esigenze specifiche. Tuttavia, è importante notare che l’utilizzo di SD3 richiede ancora una potente unità di elaborazione grafica (GPU) e una configurazione adatta per il lavoro di apprendimento automatico.

Una maggiore flessibilità hardware

A differenza dei modelli di OpenAI e Google, che richiedono l’utilizzo di un’API, SD3 offre maggiore flessibilità hardware. Gli utenti non sono limitati all’utilizzo di un’API specifica, ma possono eseguire il modello su una varietà di hardware. Questa caratteristica consente agli utenti di adattare SD3 alla propria infrastruttura esistente, senza dover apportare modifiche significative.

Nuove tecniche per una qualità superiore

SD3 introduce anche nuove tecniche per migliorare la qualità delle immagini generate. Una di queste tecniche è il “flow matching“, che consente di migliorare la qualità delle immagini senza aggiungere un carico eccessivo al sistema. Questa tecnica è stata sviluppata per garantire che le immagini generate da SD3 siano ancora più realistiche e dettagliate.

Capacità multimodale e input video

Una delle caratteristiche distintive di SD3 è la sua capacità multimodale e l’elaborazione di input video. Questo significa che SD3 non si limita solo alla generazione di immagini statiche, ma è anche in grado di comprendere e generare immagini in movimento. Questa funzionalità è stata sottolineata anche dai concorrenti come Sora e Gemini, ma SD3 sembra essere all’avanguardia in questo campo.

L’impegno per la sicurezza e l’integrità

Stability AI ha posto grande attenzione alla sicurezza nell’annunciare SD3. L’azienda ha dichiarato di aver intrapreso e di continuare ad adottare misure adeguate per prevenire un uso improprio di SD3 da parte di soggetti malevoli. Questo impegno per la sicurezza inizia fin dalla fase di addestramento del modello e continua durante la fase di test, valutazione e distribuzione. Inoltre, Stability AI ha dichiarato di collaborare costantemente con ricercatori, esperti e la comunità per garantire ulteriori innovazioni nel campo dell’elaborazione delle immagini basata sull’AI.

Scopri di più da Syrus

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continua a leggere