Novità OpenAI: DevDay, Output Strutturati e GPT-4o mini
10/08/2024
OpenAI ha recentemente annunciato una serie di aggiornamenti entusiasmanti che promettono di rivoluzionare il modo in cui sviluppatori e aziende utilizzano l’intelligenza artificiale. In questo articolo, esploreremo le principali novità, tra cui il DevDay, i nuovi Output Strutturati, e il modello GPT-4o mini con opzioni di fine-tuning gratuito. Scopriamo insieme tutte le novità!
- OpenAI DevDay
- Output Strutturati
- GPT-4o mini
- Text-to-Speech nel Playground
- Function Calling nel Playground
- API Admin e Audit Logs
- SDK .NET di OpenAI
- Risorse per Sviluppatori
OpenAI DevDay
Quest’anno, l’OpenAI DevDay sarà un evento itinerante, toccando le città di San Francisco, Londra e Singapore. Questo evento è stato progettato per avvicinare l’esperienza del DevDay alla comunità globale di sviluppatori. Durante il DevDay, i partecipanti avranno l’opportunità di partecipare a sessioni pratiche, dimostrazioni dal vivo e workshop che copriranno temi come la personalizzazione dei modelli, le applicazioni multimodali e molto altro. Sarà anche possibile incontrare gli ingegneri di OpenAI e ascoltare le esperienze di sviluppatori di tutto il mondo su come stanno utilizzando la piattaforma OpenAI per costruire progetti innovativi.
Tra le attività previste ci sono workshop tecnici, sessioni di discussione su best practices per la personalizzazione dei modelli e la scalabilità, dimostrazioni dei prodotti OpenAI, e spotlight su progetti sviluppati dalla comunità. L’evento si concluderà con una cena, bevande e intrattenimento serale, offrendo un’opportunità unica per fare networking e condividere idee. Sebbene non verranno presentati nuovi modelli AI durante questi eventi, l’attenzione sarà posta sugli ultimi aggiornamenti API e sugli strumenti per sviluppatori, con un focus sulle innovazioni della comunità di sviluppatori di OpenAI.
La partecipazione all’evento è su invito e il costo di registrazione è di $450, con alcune borse di studio disponibili. Le candidature sono aperte fino al 15 agosto. Per maggiori dettagli, visita il sito ufficiale del DevDay.
Output Strutturati
OpenAI ha introdotto una nuova funzionalità chiamata Output Strutturati, progettata per garantire che gli output generati dai modelli corrispondano esattamente agli schemi JSON forniti dagli sviluppatori. Questa innovazione è stata sviluppata per migliorare l’affidabilità dei dati generati dai modelli, risolvendo uno dei problemi più comuni legati all’uso dell’intelligenza artificiale: la generazione di output coerenti e validi.
I Structured Outputs sono disponibili in due modalità tramite l’API di OpenAI: tramite il function calling e utilizzando il parametro response_format con l’opzione json_schema. Grazie a queste modalità, gli sviluppatori possono ora assicurarsi che i dati generati rispettino rigorosamente gli schemi predefiniti, riducendo al minimo la necessità di validazione manuale o di retry. Inoltre, OpenAI ha aggiornato i suoi SDK per Python e Node.js, rendendo ancora più semplice l’implementazione di queste funzionalità nelle applicazioni esistenti.
Un aspetto particolarmente rilevante di questa funzionalità è che, nei test di valutazione condotti da OpenAI, il nuovo modello gpt-4o-2024-08-06 ha ottenuto un punteggio perfetto del 100% nella conformità agli schemi JSON, a differenza del modello precedente gpt-4-0613 che ha raggiunto meno del 40%. Questo risultato dimostra la notevole affidabilità degli Output Strutturati, che consentono di generare dati strutturati da input non strutturati con un’accuratezza senza precedenti.
Per iniziare a utilizzare gli Output Strutturati, puoi consultare la documentazione dettagliata fornita da OpenAI. Questi strumenti sono disponibili per tutti i modelli che supportano il function calling, inclusi i modelli gpt-4-0613, gpt-3.5-turbo-0613, e versioni successive. OpenAI ha anche reso disponibili degli esempi pratici e delle linee guida su come implementare questa funzionalità nelle tue applicazioni, garantendo una maggiore sicurezza e affidabilità dei dati generati.
Per maggiori dettagli, visita la pagina Introducing Structured Outputs in the API e consulta le guide ufficiali sugli Structured Outputs per iniziare subito a sfruttare questa potente nuova funzionalità.
GPT-4o mini
OpenAI ha recentemente rilasciato una versione avanzata del suo modello di intelligenza artificiale, chiamato GPT-4o mini. Questo modello rappresenta un’importante evoluzione nel campo dei modelli di piccole dimensioni, offrendo una combinazione unica di prestazioni elevate e costi ridotti. Infatti, il GPT-4o mini è il modello più economico di OpenAI, costando il 60% in meno rispetto a GPT-3.5 Turbo, pur mantenendo un livello di intelligenza superiore e una velocità comparabile.
Il GPT-4o mini è progettato per gestire compiti più leggeri e veloci, ed è perfetto per attività che richiedono un’elevata efficienza, come i compiti di visione o altre applicazioni che non necessitano di risorse computazionali estese. OpenAI consiglia di scegliere il GPT-4o mini in quei contesti in cui in precedenza si sarebbe utilizzato il modello GPT-3.5 Turbo, poiché il nuovo modello è non solo più economico, ma anche più capace.
Un altro aspetto interessante è la possibilità di fine-tuning gratuito del GPT-4o mini fino al 23 settembre, un’offerta estesa a tutti i clienti a pagamento che rientrano nei livelli di utilizzo da 1 a 5 dell’API. Questa opportunità permette di personalizzare ulteriormente il modello, rendendolo ancora più adatto alle specifiche esigenze aziendali, senza costi aggiuntivi fino alla data limite.
Il GPT-4o mini supporta anche gli Output Strutturati, garantendo che gli output generati siano conformi agli schemi JSON forniti, migliorando ulteriormente l’affidabilità del modello. Per maggiori informazioni su come utilizzare GPT-4o mini e le sue potenzialità, puoi consultare la pagina ufficiale GPT-4o mini e il documento su GPT-4o.
Text-to-Speech nel Playground
OpenAI ha reso ancora più semplice creare audio utilizzando la sua API di Text-to-Speech (TTS) grazie all’introduzione del nuovo TTS Playground. Questo strumento innovativo permette agli sviluppatori di generare rapidamente audio inserendo un messaggio di testo e selezionando una delle sei voci preimpostate disponibili. Il TTS Playground rende accessibile a chiunque l’uso della tecnologia di sintesi vocale, facilitando l’integrazione dell’audio in varie applicazioni, come assistenti virtuali, strumenti educativi, e molto altro.
Il Playground rappresenta un ambiente interattivo e user-friendly, progettato per velocizzare il processo di sviluppo con l’API TTS. Non solo semplifica la generazione di contenuti audio, ma consente anche di sperimentare con diverse voci per trovare quella più adatta alle specifiche esigenze del progetto. Questa funzionalità è particolarmente utile per sviluppatori che desiderano testare e implementare rapidamente soluzioni di sintesi vocale senza dover configurare complessi ambienti di sviluppo.
Per iniziare a esplorare le potenzialità del Text-to-Speech di OpenAI e sperimentare le diverse voci disponibili, puoi accedere al TTS Playground e iniziare subito a creare audio personalizzato in pochi semplici passi.
Function Calling nel Playground
OpenAI ha introdotto una potente funzionalità di Function Calling direttamente nel Playground, rendendo più semplice per gli sviluppatori definire e testare funzioni in modo rapido ed efficiente. Grazie a questa funzionalità, è possibile descrivere una o più funzioni e fare in modo che il modello generi in modo intelligente un oggetto JSON contenente gli argomenti necessari per chiamare tali funzioni. Questo approccio permette di creare interazioni più dinamiche e automatizzate, riducendo il tempo necessario per scrivere codice e aumentando l’efficacia dello sviluppo.
Il Function Calling è particolarmente utile per costruire applicazioni avanzate che richiedono l’integrazione di funzionalità complesse, come la gestione di database, la generazione di contenuti su misura o l’automazione di processi decisionali. Ora, con l’integrazione di questa funzionalità nel Playground, gli sviluppatori possono definire e testare rapidamente le loro funzioni, visualizzando immediatamente come il modello gestisce e restituisce i dati in formato JSON.
Per iniziare a sperimentare con il Function Calling e testare le tue funzioni in modo interattivo, puoi accedere al Playground e sfruttare tutte le potenzialità di questa nuova funzionalità.
API Admin e Audit Logs
OpenAI ha introdotto due nuove API per aiutare le organizzazioni a gestire e monitorare le proprie operazioni in modo più efficace: la Admin API e la Audit Logs API. Questi strumenti sono progettati per fornire un controllo completo sulle attività amministrative e per garantire la sicurezza e la trasparenza all’interno delle organizzazioni che utilizzano la piattaforma OpenAI.
La Admin API permette di gestire in modo programmatico inviti, utenti, progetti e account di servizio. Questo significa che le organizzazioni possono automatizzare molti processi di amministrazione, riducendo il carico manuale e migliorando l’efficienza operativa. Ad esempio, è possibile invitare nuovi membri al progetto, assegnare ruoli specifici e gestire account di servizio direttamente tramite l’API, semplificando la gestione di team e risorse a livello organizzativo.
La Audit Logs API offre un registro dettagliato di tutte le azioni e modifiche effettuate all’interno dell’organizzazione. Questa funzionalità è essenziale per il monitoraggio della sicurezza e per garantire che tutte le attività siano tracciabili. I log registrano informazioni come i login degli utenti, le modifiche ai progetti e altre azioni rilevanti, fornendo alle organizzazioni una visione chiara e completa delle attività all’interno della piattaforma. Una volta attivata la registrazione dei log nelle impostazioni dell’organizzazione, per motivi di sicurezza, questa non può essere disattivata.
Per iniziare a utilizzare queste API, è necessario generare una chiave API Admin attraverso la sezione di panoramica dell’organizzazione sulla piattaforma OpenAI. Questa chiave permette l’accesso ai vari endpoint amministrativi, garantendo un alto livello di controllo e gestione. Per maggiori dettagli, consulta le pagine ufficiali delle API per l’Admin API e per l’Audit Logs API.
SDK .NET di OpenAI
In collaborazione con Microsoft, OpenAI ha rilasciato il nuovo SDK .NET, attualmente in fase beta, che consente di integrare facilmente i modelli di OpenAI nelle applicazioni .NET. Questo SDK rappresenta un passo avanti significativo per gli sviluppatori che lavorano nell’ecosistema .NET, poiché offre un’interfaccia semplice e diretta per sfruttare le potenzialità dei modelli di intelligenza artificiale di OpenAI all’interno delle loro applicazioni.
L’installazione della libreria è semplice: basta eseguire il comando dotnet add package OpenAI --prerelease per aggiungere il pacchetto al proprio progetto. Una volta installata, la libreria può essere utilizzata insieme alla propria chiave API segreta per avviare interazioni con i modelli, come ad esempio generare completamenti di chat utilizzando il modello gpt-4o-mini. Questa libreria è stata progettata per essere intuitiva, permettendo agli sviluppatori di concentrarsi sullo sviluppo delle loro applicazioni senza dover gestire complessità tecniche aggiuntive.
Oltre alla libreria ufficiale di OpenAI, la comunità di sviluppatori ha creato diverse librerie compatibili che possono essere utilizzate con l’API di OpenAI e i servizi Azure OpenAI. Tra queste, si trovano librerie per vari linguaggi di programmazione, inclusi C#, Java, Go, Python, e molti altri. È importante notare che, mentre queste librerie comunitarie offrono alternative utili, OpenAI non verifica la correttezza o la sicurezza di questi progetti, per cui è consigliabile utilizzarle con cautela.
Per iniziare a utilizzare l’SDK .NET di OpenAI, puoi trovare il codice sorgente e la documentazione ufficiale su GitHub. Ulteriori dettagli e risorse sono disponibili nella documentazione ufficiale di OpenAI e nel post della community di Microsoft.
Risorse per Sviluppatori
Per supportare al meglio la community degli sviluppatori, OpenAI ha recentemente aggiornato la sua pagina delle documentazioni, arricchendola con nuove risorse per sviluppatori. Queste risorse includono guide, app di esempio e cookbooks, pensati per aiutarti a iniziare e a costruire sulla piattaforma OpenAI, sfruttando al massimo le sue potenzialità.
Tra le risorse più utili recentemente aggiunte, puoi trovare una guida completa su come addestrare, valutare e distribuire un modello GPT-4o mini fine-tuned. Questa guida è essenziale per chi desidera personalizzare i modelli di OpenAI per adattarli a specifici contesti aziendali o di ricerca. Un’altra risorsa preziosa è il tutorial su come chiamare funzioni con l’API di completamento chat, una funzionalità avanzata che consente di creare interazioni più sofisticate all’interno delle applicazioni.
Per aumentare l’affidabilità del modello, OpenAI ha anche pubblicato una guida su come implementare guardrails contro le allucinazioni, riducendo il rischio che il modello generi risposte imprecise o fuorvianti. Altre risorse includono esempi pratici su come enforce tool use in un contesto di assistenza clienti, generare dati sintetici per l’addestramento e il fine-tuning dei modelli, e su come utilizzare gli embedding CLIP con RAG multimodale per la ricerca avanzata di immagini.
Queste risorse sono progettate per essere facili da seguire e applicabili a una vasta gamma di scenari d’uso, offrendo agli sviluppatori gli strumenti necessari per sfruttare al meglio le capacità avanzate della piattaforma OpenAI. Per esplorare tutte queste risorse e molto altro, visita la pagina dei cookbooks di OpenAI.