Google Gemini 1.5 Pro rivoluziona l’analisi video: ecco come
21/02/2024
Google ha annunciato l’uscita del suo nuovo modello Gemini 1.5 Pro, appartenente alla famiglia di modelli GenAI. Questo nuovo modello presenta significativi miglioramenti rispetto al suo predecessore, Gemini 1.0 Pro, soprattutto per quanto riguarda la quantità di dati che può elaborare. Gemini 1.5 Pro può elaborare circa 700.000 parole o circa 30.000 righe di codice, 35 volte in più rispetto a Gemini 1.0 Pro. Inoltre, essendo un modello multimodale, può anche elaborare fino a 11 ore di audio o un’ora di video in diverse lingue.
Tuttavia, è importante sottolineare che attualmente esiste una versione di Gemini 1.5 Pro disponibile solo per un numero limitato di sviluppatori e clienti, che può elaborare solo circa 100.000 parole alla volta. Google definisce ancora questa versione sperimentale e consente solo a sviluppatori approvati di pilotarla tramite il proprio strumento di sviluppo GenAI, AI Studio. Alcuni clienti che utilizzano la piattaforma Vertex AI di Google hanno anche accesso a Gemini 1.5 Pro con input di grandi dimensioni, ma non tutti.
La finestra di contesto di Gemini 1.5 Pro di Google
Il contesto di un modello AI si riferisce ai dati di input che può prendere in considerazione. Modelli con finestre di contesto ampie possono comprendere meglio conversazioni e flussi narrativi.
Google ha presentato Gemini 1.5 Pro, un modello con una finestra di contesto di 1 milione di token, la più ampia finora. Precedentemente Anthropic deteneva il record con 200.000 token. Una finestra così ampia permette analisi approfondite di codice, documenti lunghi e conversazioni. Google ha mostrato demo con ricerche in trascrizioni e film.
I tempi di risposta però sono lenti, da 20 secondi a 1 minuto. Google sta lavorando per ridurli e sta testando una versione da 10 milioni di token. La latenza potrebbe limitare applicazioni conversazionali e analisi di codice. I vantaggi dipendono dall’uso specifico. Per ricerche approfondite il tempo extra potrebbe essere accettabile.
Altri miglioramenti
Oltre all’ampliamento della finestra di contesto, Gemini 1.5 Pro presenta miglioramenti generali nella qualità grazie ad una nuova architettura basata su modelli esperti più piccoli e specializzati. Questo approccio suddivide i compiti in sotto-compiti assegnati ai modelli più adatti.
Google afferma che la qualità è comparabile a quella di Gemini Ultra, il modello di punta precedente, superando Gemini 1.0 Pro nella maggior parte dei benchmark interni. Tuttavia è difficile quantificare con precisione tali confronti data la natura privata dell’anteprima.
I prezzi non sono stati rivelati e rappresentano una grande incognita. Durante l’anteprima l’accesso sarà gratuito, ma in futuro verranno introdotti pacchetti a pagamento graduali per finestre di contesto crescenti.
Non è chiaro nemmeno il rapporto con Gemini Ultra in termini di sviluppo futuro e miglioramenti. Gemini 1.5 Pro sembra superare Ultra per alcuni aspetti, il che potrebbe creare confusione su quale sia effettivamente il modello di punta nella linea Gemini. Nel complesso l’annuncio lascia aperte molte questioni sul posizionamento dei vari modelli Google e sulla futura disponibilità e prezzi per gli utenti finali.