Microsoft presenta Phi-3: il modello AI più compatto
29/04/2024
Microsoft ha appena lanciato Phi-3, la sua ultima creazione nel campo dell’intelligenza artificiale. Questo nuovo modello rappresenta una svolta significativa, poiché è il più piccolo mai realizzato dall’azienda fino ad oggi.
Introduzione a Phi-3
Phi-3 è un modello di intelligenza artificiale leggero sviluppato da Microsoft. Misura 3,8 miliardi di parametri, il che lo rende molto più piccolo rispetto ai modelli precedenti come GPT-4. Tuttavia, nonostante le sue dimensioni ridotte, è in grado di fornire risposte simili a modelli 10 volte più grandi di lui.
Questo modello è stato addestrato su un set di dati più piccolo rispetto ai modelli di grandi dimensioni, ma ciò non ha compromesso le sue prestazioni. Phi-3 è ora disponibile su Azure, Hugging Face e Ollama, consentendo a sviluppatori e aziende di sfruttare il suo potenziale.
Phi-3 ha appreso da storie per la nanna create da altri LLM (Large Language Models). I ricercatori di Microsoft si sono ispirati al modo in cui i bambini imparano dalle storie per la nanna, che utilizzano parole e strutture di frasi più semplici per parlare di argomenti più complessi. Secondo Eric Boyd, vicepresidente corporate di Microsoft Azure AI Platform, Phi-3 è stato addestrato con un “curriculum” che coinvolgeva una lista di oltre 3.000 parole. Questo approccio ha permesso al modello di acquisire conoscenze specifiche e competenze di ragionamento.
Caratteristiche e vantaggi di Phi-3
Nonostante le sue dimensioni ridotte, Phi-3 è in grado di offrire prestazioni paragonabili a modelli molto più grandi. Microsoft sostiene che Phi-3 Mini, il primo modello della serie, è altrettanto capace dei LLM come GPT-3.5, ma in una forma più compatta.
I modelli di intelligenza artificiale più piccoli come Phi-3 offrono diversi vantaggi rispetto ai loro omologhi più grandi. Sono generalmente meno costosi da eseguire e offrono prestazioni migliori su dispositivi personali come telefoni cellulari e laptop. Questo li rende ideali per sviluppatori e aziende che desiderano utilizzare l’intelligenza artificiale per applicazioni personalizzate.
Inoltre, poiché i modelli più piccoli richiedono meno potenza di calcolo, sono anche più accessibili in termini di costo. Questo li rende una scelta attraente per molte aziende che lavorano con set di dati di dimensioni più ridotte.
Applicazioni di Phi-3
Phi-3 può essere utilizzato in una varietà di settori e applicazioni. Ad esempio, potrebbe essere impiegato per lo sviluppo di assistenti virtuali, chatbot, e per l’assistenza nella scrittura di codice. La sua capacità di comprendere istruzioni complesse lo rende adatto per compiti che richiedono un’elaborazione del linguaggio naturale avanzata.
Inoltre, Phi-3 può essere applicato anche nel campo della ricerca scientifica, in particolare per l’analisi di documenti tecnici e la sintesi di informazioni complesse. La sua capacità di apprendere da una vasta gamma di fonti gli consente di fornire risultati accurati e pertinenti.
Concorrenti e modelli simili
Microsoft non è l’unica azienda che sviluppa modelli di intelligenza artificiale di dimensioni ridotte. Google, ad esempio, ha i suoi modelli Gemma 2B e 7B che sono utilizzati per la creazione di chatbot e il lavoro legato al linguaggio. Anthropic ha creato Claude 3 Haiku, un modello in grado di leggere e sintetizzare rapidamente documenti di ricerca complessi.
Tuttavia, Microsoft si distingue per la sua approccio innovativo nell’addestramento di Phi-3. L’uso di storie per la nanna e la creazione di un “curriculum” per l’apprendimento del modello dimostrano l’impegno dell’azienda nell’esplorare nuove strategie di addestramento per migliorare le prestazioni dei propri modelli di intelligenza artificiale.