Midjourney v6: le nuove funzionalità
28/12/2023
Midjourney, la piattaforma di generazione di immagini basata su intelligenza artificiale, ha appena lanciato la sua ultima versione, Midjourney v6. Questo aggiornamento promette miglioramenti significativi in termini di realismo delle immagini generate e la possibilità di aggiungere testo convincente alle immagini stesse.
Inoltre, la versione v6 offre maggiori dettagli nelle prompt e altre caratteristiche interessanti. Questa nuova iterazione di Midjourney è attualmente disponibile su Discord ed è ancora in fase “alpha”. Tuttavia, i primi test mostrano un miglioramento notevole su tutti i fronti, ad eccezione della velocità, che sembra essere diminuita.
Midjourney v6: Miglioramento generale e nuove funzionalità
Gli utenti che stanno testando Midjourney v6 hanno notato diversi cambiamenti rispetto alla versione precedente, Midjourney v5.2. Ad esempio, le prompt possono essere più lunghe e gli utenti possono specificare i colori e altri dettagli delle immagini. Inoltre, la composizione delle immagini può essere controllata utilizzando il linguaggio naturale e ora è possibile aggiungere testo alle immagini. Midjourney v6 dimostra anche un miglioramento nell’interpretazione delle sfumature grammaticali e permette di aggiungere cornici e bordi alle immagini tramite testo descrittivo.
Su Reddit, nella comunità r/singularity, dove si discute principalmente di tecnologia legata all’intelligenza artificiale, gli utenti stanno compilando una lista di tutti i cambiamenti notati finora. Oltre alle funzionalità menzionate in precedenza, gli utenti hanno segnalato un miglioramento nella generazione di immagini di persone reali e una maggiore capacità di comprendere gli enigmi grammaticali, come quello famoso di “Eats, shoots and leaves”.
Midjourney v6: Risultati più realistici nelle immagini generate
Uno dei miglioramenti più significativi di Midjourney v6 riguarda la generazione di immagini di persone reali. In precedenza, la versione v5.2 non riusciva a generare immagini dettagliate e realistiche di personaggi famosi come Albert Einstein e Marie Curie. Tuttavia, con la nuova versione v6, queste immagini sembrano molto più realistiche e dettagliate.
Ad esempio, confrontando le immagini di “Albert Einstein che fa un esperimento scientifico” tra la versione v5.2 e v6, si nota un miglioramento significativo nelle immagini generate dalla versione v6. I capelli di Einstein sono più dettagliati, la pelle sembra più naturale e l’illuminazione è molto più realistica. Nel complesso, l’immagine generata dalla versione v6 sembra molto più accurata rispetto alla versione precedente.
Lo stesso miglioramento si può notare nelle immagini di “Marie Curie nel suo laboratorio”. Mentre la versione v5.2 generava immagini molto stilizzate e non realistiche, Midjourney v6 mostra un livello di dettaglio impressionante. Le immagini sono molto più realistiche e l’illuminazione è eccezionale.
Midjourney v6: aggiunta di testo alle immagini
Una delle funzionalità più interessanti di Midjourney v6 è la possibilità di aggiungere testo alle immagini generate. Anche se i risultati non sono eccezionali, rappresentano comunque un notevole miglioramento rispetto alla versione v5.2, che era quasi inadeguata nell’inserimento del testo.
Ad esempio, consideriamo la richiesta di generare un “poster di un film sulla fotografia chiamato ‘Fotografia’”. La versione v5.2 di Midjourney non riusciva a creare un poster convincente, mentre la versione v6 offre risultati migliori. Anche se ci sono ancora margini di miglioramento, la possibilità di aggiungere testo alle immagini è un’aggiunta molto gradita.
Midjourney v6: superamento delle problematiche e dei bias
Come tutte le piattaforme di generazione di immagini basate su intelligenza artificiale, anche Midjourney ha delle problematiche da affrontare. Una delle principali sfide è rappresentata dai bias che possono emergere durante il processo di generazione delle immagini. Ad esempio, nella versione v5.2 di Midjourney, la richiesta di generare un’immagine di “una donna al lavoro” produceva immagini di donne giovani, magre e di razza bianca, spesso intenti a lavorare a una macchina da cucire. Questi risultati riflettono chiaramente dei bias presenti nel set di dati utilizzato per addestrare Midjourney.
Anche nella versione v6, i risultati non sono molto diversi. Le immagini generate mostrano ancora donne giovani e di razza bianca, anche se appaiono più realistiche rispetto alla versione precedente. È importante sottolineare che questi bias non sono necessariamente colpa di Midjourney, ma derivano dal fatto che la piattaforma è stata addestrata su immagini preesistenti che riflettono tali bias.
Midjourney v6: un passo avanti significativo
Nonostante le sfide e i limiti, Midjourney v6 rappresenta un significativo passo avanti rispetto alla versione v5.2. I miglioramenti nell’aspetto realistico delle immagini generate e l’aggiunta della funzionalità di inserimento del testo sono senza dubbio dei progressi importanti. Tuttavia, ci sono ancora margini di miglioramento, soprattutto per quanto riguarda la generazione di testo più convincente.