Google svela gemma: nuovi LLM leggeri per l’IA
26/02/2024
Appena una settimana dopo il lancio dell’ultima versione dei suoi modelli Gemini, Google annuncia oggi il lancio di Gemma, una nuova famiglia di modelli aperti leggeri. Questi nuovi modelli, denominati Gemma 2B e Gemma 7B, sono “ispirati da Gemini” e sono disponibili per uso commerciale e di ricerca. Google afferma che questi modelli sono “all’avanguardia” ma non ha fornito dettagli specifici sulle prestazioni rispetto ad altri modelli simili. Tuttavia, l’azienda ha sottolineato che si tratta di modelli esclusivamente per la decodifica densa, la stessa architettura utilizzata per i modelli Gemini e PaLM precedenti.
Caratteristiche dei nuovi modelli
I modelli Gemma, come i modelli Gemini, sono modelli di decodifica densa, che li rende adatti a una varietà di casi d’uso. Secondo Tris Warkentin, direttore del product management di Google DeepMind, la qualità della generazione è notevolmente migliorata negli ultimi anni, consentendo di utilizzare modelli più leggeri per compiti che in passato richiedevano modelli molto più grandi. Questo apre nuove possibilità nello sviluppo di applicazioni di intelligenza artificiale, permettendo di eseguire inferenze e ottimizzazioni su desktop o laptop locali con GPU RTX o su un singolo host in GCP con Cloud TPUs.
Google afferma che i modelli Gemma possono essere utilizzati per inferenze e ottimizzazioni a discrezione degli sviluppatori. Una volta preaddestrati e sintonizzati, questi modelli possono essere eseguiti ovunque. Per facilitare l’utilizzo dei modelli Gemma, Google fornisce accesso a notebook pronti all’uso tramite Colab e Kaggle, nonché integrazioni con Hugging Face, MaxText e NeMo di Nvidia.
Aperti ma non open source
Google sottolinea che i modelli Gemma sono aperti, ma non open source. Jeanine Banks di Google ha spiegato che il termine “modelli aperti” si riferisce all’accesso ampio che sviluppatori e ricercatori hanno per personalizzare e ottimizzare i modelli, ma ciò non implica necessariamente una licenza open source per la redistribuzione o la proprietà delle varianti sviluppate. Pertanto, Google ha scelto di definire i suoi modelli Gemma come “modelli aperti”.
Oltre ai nuovi LLM, Google sta anche rilasciando un nuovo toolkit AI generativo responsabile che fornisce “guida e strumenti essenziali per la creazione di applicazioni AI più sicure con Gemma“. Questo toolkit mira a garantire che l’uso dei modelli Gemma rispetti principi etici e responsabili.