Al MIT hanno progettato una intelligenza artificiale che riconosce gli oggetti per associazione

Al MIT hanno progettato una intelligenza artificiale che riconosce gli oggetti per associazione

Il mondo della ricerca non si ferma mai e sta facendo passi da gigante. Con l’avanzare del tempo stanno nascendo sempre più sistemi basati sull’intelligenza artificiale e sul machine learning in grado di facilitare gli individui nel portare a termine le loro azioni quotidiane e non solo. Stanno nascendo numerose macchine sofisticate mai viste prime, come il nuovo modello di Google che riesce ad indovinare le previsioni meteo nel breve termine, ma adesso un altro progresso proviene dal MIT.

Il Massachusetts Institute of Technology (MIT), una delle più importanti università di ricerca del mondo, è riuscito a sviluppare un modello di apprendimento automatico (machine learning) che non solo è in grado di comprendere le relazioni che ci sono tra gli oggetti all’interno di uno scenario, ma anche di generare immagini accurate a partire dalle scene delle descrizioni di testo. Grazie all’intelligenza artificiale, questo nuovo modello potrebbe segnare una svolta nel nostro futuro, poiché in grado di aiutare i robot a comprendere le interazioni nel mondo proprio come fanno gli umani. 

Fino a questa svolta i modelli di apprendimento profondo (deep learning) hanno sempre fatto fatica a comprendere le relazioni tra i singoli oggetti in una scena; ad esempio entrando in cucina ci sono dei coltelli a sinistra del forno a microonde che si trova dietro ai fornelli. Non riuscendo a comprendere le relazioni che ci sono tra gli oggetti e, dunque, senza conoscere la relazione che c’è tra questi, un robot progettato appositamente per aiutare qualcuno in cucina (riprendendo l’esempio di prima) non riuscirebbe ad eseguire un comando come “prendi i coltelli che si trovano a sinistra del forno a microonde e mettili davanti ai fornelli”.

Il MIT sta cercando di risolvere questo problema sviluppando un modello che riesce a comprendere le relazioni tra gli oggetti; tale modello rappresenta le relazioni individuali una alla volta e poi mette insieme le rappresentazioni per descrivere la scena nel complesso. In questo modo il modello sarebbe in grado di generare immagini più accurate anche quando nello scenario sono presenti più oggetti che hanno diverse relazioni tra di loro, risultando particolarmente d’aiuto per i robot industriali che devono eseguire attività complesse e suddivise in più fasi ottenendo un risultato ancora più efficace. A tal proposito, uno studente di dottorato al Computer Science and Artificial Intelligence Laboratory (CSAIL), Yilun Du, ha detto: “Nella nostra mente, quando comprendiamo una scena, la capiamo davvero in base alle relazioni tra gli oggetti. Pensiamo che costruendo un sistema in grado di comprendere le relazioni tra gli oggetti, potremmo utilizzare quel sistema per manipolare e modificare in modo più efficace i nostri ambienti”.