Microsoft Orca-Math: la rivoluzione nell’IA matematica
12/03/2024
Microsoft ha recentemente presentato il suo nuovo modello di Intelligenza Artificiale chiamato Orca-Math, che ha dimostrato di superare modelli 10 volte più grandi. Questo nuovo modello è stato sviluppato dal team di ricerca di Microsoft ed è parte di un progetto più ampio per potenziare le capacità dei modelli di intelligenza artificiale di dimensioni più ridotte.
Un grande passo avanti per l’IA nel campo della matematica
Orca-Math è stato progettato specificamente per eccellere nella risoluzione di problemi matematici. Utilizzando la tecnologia sviluppata da Mistral, una startup francese, Orca-Math ha dimostrato di superare la maggior parte dei modelli di intelligenza artificiale più grandi, ad eccezione di Gemini Ultra di Google e GPT-4 di OpenAI.
Dimensioni ridotte, prestazioni superiori
Ciò che rende Orca-Math davvero impressionante è il fatto che ha solo 7 miliardi di parametri, ma riesce comunque a competere e quasi a eguagliare le prestazioni dei modelli con un numero molto maggiore di parametri. Questo dimostra che la dimensione non è l’unico fattore determinante per le prestazioni di un modello di intelligenza artificiale.
Come è stato creato il modello Orca-Math
Il team di ricerca di Microsoft ha adottato un approccio innovativo per creare il modello Orca-Math. Hanno generato un nuovo set di 200.000 problemi matematici utilizzando agenti specializzati, tra cui agenti di intelligenza artificiale studenteschi e agenti di intelligenza artificiale insegnanti che correggevano le risposte degli studenti. Hanno utilizzato anche dataset open-source esistenti e hanno addestrato il modello utilizzando le risposte fornite da GPT-4 di OpenAI.
Utilizzo di dati sintetici per migliorare le prestazioni
Per migliorare ulteriormente le prestazioni del modello Orca-Math, il team di ricerca di Microsoft ha utilizzato un metodo chiamato “Kahneman-Tversky Optimization” (KTO), sviluppato dalla startup Contextual AI. Questo metodo si basa sullo studio del lavoro degli economisti Kahneman e Tversky sul processo decisionale umano. Utilizzando il KTO insieme a una tecnica di raffinamento supervisionato, il team è riuscito a migliorare l’accuratezza delle risposte fornite dal modello Orca-Math.
Un set di problemi matematici open-source
Inoltre, il team di Microsoft ha reso disponibile il set di 200.000 problemi matematici generati da Orca-Math sotto una licenza MIT per promuovere l’innovazione e l’esplorazione da parte di start-up e aziende. Questa iniziativa contribuisce all’incremento delle risorse disponibili per l’addestramento dei modelli di intelligenza artificiale e dimostra l’importanza dei dati sintetici nel migliorare le capacità dei modelli.
Progressi nell’IA per la risoluzione dei problemi matematici
Il lancio del modello Orca-Math rappresenta un importante passo avanti nell’applicazione dell’intelligenza artificiale per la risoluzione dei problemi matematici. Questo modello dimostra che le dimensioni non sono l’unico fattore che determina le prestazioni di un modello di intelligenza artificiale e che l’utilizzo di dati sintetici può contribuire significativamente al miglioramento delle capacità dei modelli.