Dai testi alle immagini: scopri GPT-4, il nuovo modello di Intelligenza Artificiale multimodale

Dai testi alle immagini: scopri GPT-4, il nuovo modello di Intelligenza Artificiale multimodale

15/03/2023 0 By fogliotiziana

Questa era una delle grandi domande su GPT-4. Il nuovo modello OpenAI sarà in grado di interpretare o generare un formato diverso dal testo?

Ora abbiamo la risposta: GPT-4 è in grado di integrare un prompt composto da un testo e un’immagine. D’altra parte, i risultati forniti da GPT-4 saranno limitati al formato testo. Voci recenti, carpite da un dirigente Microsoft, hanno fatto sperare in altre possibilità legate alla generazione di video. Ma il mix di immagini e testo è già una novità impressionante…

Creatività, immagine e gestione del contesto con GPT-4

OpenAI presenta le tre principali novità del suo modello di linguaggio:

  1. Creatività: GPT-4 è in grado di soddisfare al meglio le esigenze creative dei suoi utenti. OpenAI evoca la progettazione di compiti come la composizione musicale, la sceneggiatura e/o la riproduzione dello stile dell’autore.
  2. Formato: GPT-4 accetta quindi immagini come input. Questa nuova funzionalità consente di generare legende, classificazioni o eseguire analisi basate sull’interpretazione delle immagini.
  3. Contesto: GPT-4 è in grado di gestire più di 25.000 parole, il che consente di creare testi più lunghi, partecipare a conversazioni più ricche, effettuare ricerche e analisi di documenti più complete.

La qualità dei risultati ottenuti con GPT-4

OpenAI pubblica ricerche su GPT-4 in modo da poter misurare la qualità dei risultati ottenuti. Sono stati quindi effettuati dei benchmark per valutare i testi proposti dal nuovo modello linguistico. E non sorprende che GPT-4 superi di gran lunga GPT-3.5 in tutti i test.

Un’altra informazione molto interessante, GPT-4 permette di ottenere ottimi risultati in molte lingue. In italiano, ad esempio, il livello di precisione ottenuto con GPT-4 è superiore a quello ottenuto in inglese con GPT-3.5. Il nostro linguaggio è uno dei meglio gestiti dal nuovo modello OpenAI.

Oltre i numeri: ciò significa che gli utenti saranno in grado di ottenere risultati di qualità superiore utilizzando GPT-4, rispetto a GPT-3.5. Vedremo con l’uso quanto la qualità delle risposte sia superiore a quelle di ChatGPT. OpenAI indica di aver lavorato per 6 mesi sulla sicurezza delle risposte fornite dal suo nuovo modello linguistico.

GPT-4 ha l’82% in meno di probabilità di rispondere a richieste di contenuti non autorizzati e il 40% in più di probabilità di produrre risposte fattuali, rispetto a GPT 3.5.“.

OpenAI ha integrato più feedback umani, compreso quello raccolto da ChatGPT, per migliorare “il comportamento di GPT-4“. 50 esperti sono stati invitati a migliorare la sicurezza e la protezione dell’IA. L’editore si è anche basato sugli usi osservati dei suoi modelli precedenti “nel mondo reale”. OpenAI promette aggiornamenti regolari per migliorare continuamente GPT-4.

L’integrazione di GPT-4 nelle applicazioni

Quando OpenAI ha presentato il suo modello precedente (GPT-3) nel maggio 2020, gli sviluppatori hanno potuto accedervi 2 mesi dopo tramite l’API. Gli utenti hanno quindi potuto usufruire di questa tecnologia a partire dalla seconda metà del 2020.

Con GPT-4, andrà molto più veloce: OpenAI ha collaborato con diversi fornitori per creare nuove possibilità nelle applicazioni più diffuse. Duolingo, Be My Eyes, Stripe, Morgan Stanley, Khan Academy e il governo islandese svelano oggi nuove funzionalità basate su GPT-4.

Come accedere a GPT-4?

Vuoi accedere a GPT-4? Per gli sviluppatori, il nuovo modello linguistico sarà accessibile tramite l’API OpenAI. Al momento è su invito: per ottenerne uno, devi prima registrarti nella lista d’attesa GPT-4. Puoi anche beneficiare delle capacità superiori di GPT-4 tramite ChatGPT Plus!

L’accesso a GPT-4 è attualmente solo per l’inserimento di testo. Per i prompt basati su immagini e testo, OpenAI afferma che per ora funziona con un solo partner, Be My Eyes.

I limiti di GPT-4

Sebbene GPT-4 sembri molto più potente – e più preciso – di GPT-3 e 3.5, OpenAI ricorda che un gran numero di limitazioni e rischi associati alla sua tecnologia rimangono presenti e conosciuti: pregiudizi sociali, risposte inaspettate… l’obiettivo dell’editore è quello di mitigare il più possibile i problemi legati ai suoi modelli linguistici al fine di evitare usi dannosi o risultati problematici. Vedremo nei prossimi mesi se gli utilizzi di GPT-4 consentiranno di cancellare i limiti di ChatGPT e di altri servizi basati su tecnologie OpenAI.

Ti consiglio di leggere anche…

L’Intelligenza Artificiale è perfetta? Scopri perché ci sono ancora dei limiti

Trova le differenze: scopri come distinguere le immagini create dall’intelligenza artificiale con questi 5 trucchi

Gli attori presto costretti a vendere la propria voce… per l’Intelligenza Artificiale?