Google Ellmann: L’app che usa l’IA per raccontare la tua storia
13/12/2023
Negli ultimi anni, l’intelligenza artificiale ha rivoluzionato molti settori, compreso quello della fotografia. Google, una delle principali aziende tecnologiche al mondo, ha proposto un nuovo progetto chiamato “Progetto Ellmann” che mira a utilizzare l’IA per creare una visione globale della vita degli utenti attraverso i dati dei telefoni cellulari, come fotografie e ricerche. Questa tecnologia potrebbe consentire a Google Photos di offrire un servizio ancora più personalizzato e coinvolgente per i suoi oltre 1 miliardo di utenti.
Cos’è il Progetto Ellmann
Il Progetto Ellmann si basa sull’utilizzo di grandi modelli di linguaggio (LLM) come Gemini, sviluppato da Google, per analizzare i risultati delle ricerche, individuare pattern nelle foto degli utenti e creare un chatbot in grado di rispondere a domande precedentemente impossibili. L’obiettivo finale del progetto è quello di creare un “racconto della tua vita”, in cui l’IA sarà in grado di estrapolare informazioni contestuali dalle biografie, dai momenti precedenti e successivi e dalle foto stesse per fornire una descrizione più profonda delle foto dell’utente.
Il b propone di identificare una serie di momenti significativi nella vita dell’utente, come gli anni dell’università, gli anni trascorsi nella Bay Area o gli anni come genitore. Utilizzando l’IA, sarebbe possibile estrarre informazioni non solo dalle foto stesse, ma anche dai tag e dalle posizioni per identificare i momenti più importanti nella vita dell’utente. Inoltre, il Progetto Ellmann si propone di creare un’esperienza di chat personalizzata, in cui l’utente potrà porre domande sulle proprie foto e ricevere risposte dettagliate e contestualizzate.
Gemini: Il cuore del Progetto Ellmann
Al centro del Progetto Ellmann c’è Gemini, uno dei modelli di intelligenza artificiale più avanzati sviluppati da Google. Questo modello, presentato come il più capace e avanzato fino ad oggi, è in grado di elaborare e comprendere non solo il testo, ma anche immagini, video e audio. Questa caratteristica multimodale di Gemini lo rende particolarmente adatto per il Progetto Ellmann, in quanto permette di analizzare e interpretare informazioni in modo più completo e approfondito.
Google ha lanciato Gemini come parte del suo piano di rendere disponibile l’IA a un’ampia gamma di clienti attraverso Google Cloud. Questo significa che altre aziende potranno utilizzare Gemini per sviluppare le proprie applicazioni e migliorare i propri prodotti. Ciò potrebbe aprire nuove opportunità per l’utilizzo dell’IA nel settore fotografico e consentire a Google di rimanere all’avanguardia nella creazione di esperienze personalizzate per gli utenti.
L’impatto su Google Foto e altri prodotti Google
Molti utenti utilizzano Google Foto per archiviare e organizzare le proprie foto e video. Con il Progetto Ellmann, Google potrebbe migliorare ulteriormente questo servizio, consentendo agli utenti di scoprire e rivivere i momenti più significativi della propria vita in modo più coinvolgente e personalizzato.
Ad esempio, l’IA potrebbe creare automaticamente album tematici basati su determinati periodi della vita dell’utente, come gli anni dell’università o le vacanze estive. Inoltre, grazie all’analisi delle foto e dei dati dei telefoni cellulari, Google potrebbe suggerire agli utenti nuovi interessi, luoghi da visitare o prodotti da acquistare, basandosi sulle loro preferenze e sui loro comportamenti passati.
Tuttavia, è importante sottolineare che il Progetto Ellmann è ancora in fase di sviluppo e non è chiaro se e quando verrà implementato effettivamente in Google Foto o in altri prodotti Google. Come dichiarato da un portavoce di Google, l’azienda si impegna a garantire che eventuali nuove funzionalità siano utili per gli utenti e progettate per proteggere la loro privacy e sicurezza.
La corsa dei giganti tecnologici per creare “ricordi” basati sull’IA
Il Progetto Ellmann di Google si inserisce in una corsa tra i giganti tecnologici per creare esperienze basate sull’IA che siano sempre più personalizzate e coinvolgenti per gli utenti. Google Foto e Apple Photos sono solo due esempi di come queste aziende stiano sfruttando l’IA per offrire ai propri utenti una visione più completa e significativa dei propri ricordi.
Google Foto, ad esempio, utilizza già l’IA per raggruppare foto simili e organizzarle in album facili da trovare. Apple Photos, d’altra parte, ha introdotto la funzionalità di riconoscimento facciale per identificare persone, cani e gatti nelle foto degli utenti. Entrambe le aziende stanno lavorando per migliorare costantemente queste funzionalità e offrire nuove esperienze basate sull’IA, come la creazione di album tematici o suggerimenti personalizzati basati sui luoghi visitati o sui brani musicali preferiti.
Tuttavia, l’implementazione di queste tecnologie non è priva di sfide. Ad esempio, sia Apple che Google si sono scontrate con problemi relativi all’etichettatura delle immagini. Nel 2015, entrambe le aziende hanno evitato di etichettare le persone di colore come gorilla per evitare offese e discriminazioni. Questo dimostra che l’IA può ancora avere dei limiti e che è necessario un costante monitoraggio per garantire che le funzionalità siano corrette e rispettose.