ChatGPT potrà generare immagini grazie a DALL-E 3

22/09/2023
OpenAI ha annunciato DALL-E 3, la terza versione del suo generatore di immagini a partire da testo, e la grande novità è l’integrazione con ChatGPT per ottenere risultati molto più aderenti a quello che avete in mente. Ma soprattutto sfuma il confine tra i due strumenti: è DALL-E 3 che integra ChatGPT o ChatGPT che ora può creare immagini grazie a DALL-E 3? In questo post, scoprirai tutti i dettagli a riguardo.
Miglioramento della traduzione testo-immagine
Questione esistenzialistica a parte, il nuovo sistema immagine-da-testo tende a risolvere un problema di lunga data non solo con DALL-E ma con tutti questi strumenti di IA generativa: l’inserimento di un testo sufficientemente dettagliato, spesso molto lungo, per spiegare al generatore di immagini quello che abbiamo in mente (il contesto).
Semplicità nell’uso
Ora, grazie all’integrazione con ChatGPT, non dovrai più utilizzare questo sistema, in quanto potrai semplicemente chiedere a ChatGPT di generare un prompt, al che sarà il popolare chatbot a scrivere un testo per DALL-E.
Risultati più accessibili
A questo punto DALL-E 3, come prima, ti proporrà quattro immagini basate su quel prompt che dovrebbero essere più aderenti al pensiero dell’utente e secondo OpenAI consentirà a più persone di creare arte AI perché non è necessario essere particolarmente bravi a trovare un prompt. Ovviamente, chi ha esigenze più specifiche potrà continuare a usare il sistema precedente.
Sicurezza e prevenzione di contenuti inappropriati
La società ha poi spiegato di aver dedicato molta attenzione alle misure di sicurezza per prevenire la creazione di immagini oscene o che potessero urtare la sensibilità degli utenti, lavorando con gruppi esterni specializzati nello scardinare un sistema per testarne la sicurezza.
Gestione dei personaggi pubblici
DALL-E 3 non sarà anche in grado di ricreare immagini di personaggi pubblici, a condizione che il prompt menzioni specificamente un nome. Gli sviluppatori però avvertono che lo strumento non è ancora perfetto.
Considerazioni sui copyright
Un’altra criticità riguarda i copyright. Altri generatori di immagini come Stable Diffusion e Midjourney sono stati denunciati dagli artisti per aver imitato il loro stile, e OpenAI consentirà a questi ultimi di chiedere di non includere le loro immagini nelle versioni future dei modelli di immagini a partire da testo. Il che è curioso: è un artista che deve caricare la sua immagine sul sito di OpenAI e richiederne la rimozione, non OpenAI che chiede all’artista il permesso di usarla.
In ogni caso, a differenza di DALL-E 2 che poteva imitare lo stile degli artisti sotto richiesta, DALL-E 3 è stato addestrato per rifiutare di generare immagini nello stile degli artisti viventi. DALL-E 3 è attualmente in fase di sviluppo, e verrà rilasciato per la prima volta agli utenti di ChatGPT Plus e ChatGPT Enterprise a ottobre, mentre in autunno arriverà ai laboratori di ricerca e sul suo servizio API.
Interconnessione di ChatGPT e DALL-E
A questo punto, puoi notare come ChatGPT e DALL-E sono sempre più interconnessi, e sembra che al momento il nuovo generatore di immagini utilizzi il modello GPT-4 in quanto non è stato comunicata una versione pubblica gratuita.