La conferenza annuale degli sviluppatori Google I/O è sempre un momento molto atteso, in cui il gigante tecnologico svela le sue ultime innovazioni e progetti per il futuro. L’edizione 2024 non ha deluso le aspettative, con una sequenza serrata di annunci che spaziano dall’intelligenza artificiale ai nuovi dispositivi hardware, passando per gli aggiornamenti delle piattaforme software. In questo articolo, esploreremo in dettaglio tutte le principali novità emerse dalla keynote di Google I/O 2024.
Firebase Genkit: una nuova piattaforma per lo sviluppo di app IA-powered
Uno degli annunci più significativi è stato l’introduzione di Firebase Genkit, una nuova aggiunta alla piattaforma Firebase che mira a semplificare lo sviluppo di applicazioni alimentate dall’intelligenza artificiale. Basato su un framework open source sotto licenza Apache 2.0, Genkit consente agli sviluppatori di integrare rapidamente funzionalità IA nelle loro app, sfruttando casi d’uso come la generazione e la sintesi di contenuti, la traduzione del testo e la creazione di immagini.
L’onnipresenza dell’IA durante la presentazione
Un dato curioso emerso dalla keynote è che la parola “intelligenza artificiale” è stata pronunciata ben 121 volte dal CEO Sundar Pichai durante i 110 minuti di presentazione. Questo numero, rivelato dallo stesso Pichai, sottolinea l’importanza che Google attribuisce all’IA e al suo ruolo centrale nelle sue future iniziative.
LearnLM: l’IA generativa al servizio dell’istruzione
Tra le novità presentate, spicca LearnLM, una nuova famiglia di modelli di intelligenza artificiale generativa sviluppata in collaborazione tra il team di DeepMind di Google e Google Research. Questi modelli sono specificamente progettati per fornire un tutoraggio “conversazionale” agli studenti su una vasta gamma di argomenti, semplificando e migliorando il processo di pianificazione delle lezioni per gli insegnanti.
Quiz AI-powered su YouTube
Un’altra interessante integrazione dell’IA annunciata durante la conferenza riguarda l’introduzione di quiz generati automaticamente su YouTube. Questa nuova funzionalità consentirà agli utenti di interagire attivamente con i contenuti educativi, ponendo domande di chiarimento, ottenendo spiegazioni e mettendo alla prova le proprie conoscenze attraverso test personalizzati.
Aggiornamenti per il modello Gemma
Google ha anche annunciato l’arrivo di una nuova versione del suo modello di intelligenza artificiale Gemma, che includerà un’implementazione da 27 miliardi di parametri. Questa evoluzione del sistema, ottimizzata per funzionare efficientemente su hardware Nvidia di nuova generazione e sui servizi di Google Cloud, risponde alle richieste degli sviluppatori di avere a disposizione modelli di dimensioni maggiori.
Novità per Google Play
Il negozio di applicazioni di Google, Google Play, riceverà diverse migliorie, tra cui una nuova funzionalità di discovery per le app, nuovi strumenti per l’acquisizione di utenti e aggiornamenti ai servizi a disposizione degli sviluppatori, come il Google Play SDK Console e l’API Play Integrity.
Rilevamento delle truffe durante le chiamate
Una delle caratteristiche più interessanti presentate durante la conferenza è la capacità di Gemini Nano, la versione più piccola del modello IA di Google, di rilevare potenziali tentativi di truffa durante le chiamate. Sfruttando tecniche di analisi del linguaggio, il sistema sarà in grado di individuare schemi conversazionali comunemente associati a pratiche fraudolente, come richieste di password o l’invito a effettuare acquisti di gift card.
Ask Photos: ricerca avanzata nelle immagini di Google Photos
Un’altra novità riguarda l’integrazione dell’intelligenza artificiale Gemini all’interno di Google Photos. La nuova funzionalità “Ask Photos” permetterà agli utenti di cercare all’interno della propria raccolta di immagini utilizzando query in linguaggio naturale, sfruttando la comprensione del contenuto delle foto da parte dell’IA.
Le evoluzioni del modello Gemini
Google ha approfondito ulteriormente le capacità del suo modello di intelligenza artificiale Gemini, annunciando diverse implementazioni:
Gemini in Gmail
Gli utenti di Gmail potranno presto sfruttare le funzionalità di Gemini per cercare, riassumere e redigere le proprie email, oltre a compiere azioni più complesse come elaborare resi di e-commerce.
Gemini 1.5 Pro
La nuova versione del modello Gemini 1.5 Pro sarà in grado di analizzare documenti, codici, video e registrazioni audio di dimensioni molto più ampie rispetto al passato, raddoppiando il limite massimo di token elaborabili.
Gemini Live
Google ha inoltre presentato Gemini Live, un’esperienza che consentirà agli utenti di avere conversazioni vocali approfondite con il sistema di intelligenza artificiale, con la possibilità di interrompere e interagire in tempo reale.
Gemini Nano
Infine, Google sta integrando direttamente nel client desktop di Chrome la versione più piccola del modello Gemini, Gemini Nano, per consentire agli sviluppatori di sfruttarne le funzionalità IA all’interno delle loro applicazioni.
Gemini su Android e Google Maps
L’integrazione di Gemini si estenderà anche ad altre piattaforme di Google, come il sistema operativo Android e il servizio di mappe. Gli utenti Android potranno presto trascinare e rilasciare immagini generate dall’IA direttamente nelle app, mentre gli sviluppatori avranno accesso a funzionalità di sintesi e descrizione dei luoghi basate sull’analisi di Gemini.
Nuova generazione di chip TPU
Tra gli annunci hardware, Google ha presentato la sesta generazione dei suoi chip Tensor Processing Unit (TPU), denominata Trillium. Questi nuovi processori dedicati all’IA offriranno un incremento del 4,7% delle prestazioni di calcolo rispetto alla precedente iterazione, oltre a miglioramenti specifici per l’elaborazione di embedding di grandi dimensioni.
Aggiornamenti all’esperienza di ricerca di Google
L’intelligenza artificiale di Google avrà un ruolo sempre più centrale anche nell’esperienza di ricerca, con l’introduzione di funzionalità come gli AI Overview, che forniranno sintesi informative sui risultati di ricerca, e l’integrazione di Gemini per la pianificazione di viaggi e altre attività complesse.
Imagen 3 e Veo: nuovi progressi nell’IA generativa
Infine, Google ha annunciato gli aggiornamenti ai suoi modelli di intelligenza artificiale generativa, con l’introduzione di Imagen 3, che offre miglioramenti nella comprensione dei prompt testuali e nella qualità delle immagini generate, e Veo, una soluzione per la creazione di video a partire da descrizioni testuali.
Fonte dell’articolo qui.

