TECNOLOGIA, INTERNET TRENDS, GAMING, BIG DATA

Anthropic OpenAI: Claude 3, il chatbot che supera GPT-4

Anthropic OpenAI: Claude 3, il chatbot che supera GPT-4

By auroraoddi

L’azienda di intelligenza artificiale Anthropic, sostenuta da Google e con centinaia di milioni di dollari di finanziamenti di venture capital, ha annunciato oggi l’ultima versione della sua tecnologia GenAI, chiamata Claude. Secondo l’azienda, il suo chatbot basato sull’IA supera GPT-4 di OpenAI in termini di prestazioni.

I nuovi modelli di chatbot Claude 3

La nuova generazione di modelli di chatbot di Anthropic, chiamata Claude 3, si compone di tre varianti: Claude 3 Haiku, Claude 3 Sonnet e Claude 3 Opus, quest’ultimo essendo il più potente. Tutti questi modelli mostrano “capacità aumentate” nell’analisi e nella previsione, secondo quanto afferma Anthropic. Inoltre, l’azienda sostiene che questi modelli hanno prestazioni migliori su specifici benchmark rispetto a modelli come ChatGPT, GPT-4 e Gemini 1.0 Ultra di Google.

Una caratteristica importante di Claude 3 è che è il primo GenAI multimodale di Anthropic, il che significa che può analizzare sia il testo che le immagini, in modo simile a alcune varianti di GPT-4 e Gemini di Google. Claude 3 può elaborare foto, grafici, diagrammi tecnici e disegni provenienti da PDF, presentazioni e altri tipi di documenti.

Tuttavia, ci sono alcune limitazioni nell’elaborazione delle immagini da parte di Claude 3. Anthropic ha disabilitato la capacità dei modelli di identificare le persone, probabilmente a causa delle implicazioni etiche e legali. Inoltre, l’azienda ammette che Claude 3 commette errori con immagini di “bassa qualità” (meno di 200 pixel) e ha difficoltà con compiti che richiedono ragionamento spaziale, come leggere un quadrante di un orologio analogico, e con il conteggio degli oggetti nelle immagini.

Miglioramenti rispetto ai modelli precedenti

Anthropic afferma che Claude 3 migliora anche nell’elaborazione del testo. I clienti possono generalmente aspettarsi che Claude 3 segua meglio istruzioni a più passaggi, produca output strutturato in formati come JSON e conversi in lingue diverse dall’inglese rispetto ai suoi predecessori. Secondo Anthropic, Claude 3 dovrebbe anche rifiutarsi di rispondere alle domande in modo meno frequente grazie a una “comprensione più sfumata delle richieste”. Inoltre, i modelli presto indicheranno la fonte delle loro risposte alle domande in modo che gli utenti possano verificarle.

Secondo un articolo di supporto di Anthropic, “Claude 3 tende a generare risposte più espressive e coinvolgenti. È più facile da istruire e guidare rispetto ai nostri modelli precedenti. Gli utenti dovrebbero scoprire che possono ottenere i risultati desiderati con prompt più brevi e concisi“.

Contesto esteso e finestra di contesto

Un aspetto chiave del miglioramento di Claude 3 rispetto ai modelli precedenti è l’estensione del contesto. Il contesto di un modello si riferisce ai dati di input (ad esempio, il testo) che il modello considera prima di generare l’output. I modelli con contesti ridotti tendono a “dimenticare” il contenuto delle conversazioni anche molto recenti, facendoli deviare dal tema, spesso in modo problematico. Al contrario, i modelli con un contesto esteso possono comprendere meglio il flusso narrativo dei dati e generare risposte più ricche dal punto di vista contestuale.

Anthropic afferma che Claude 3 supporterà inizialmente una finestra di contesto di 200.000 token, equivalenti a circa 150.000 parole, con alcuni clienti selezionati che avranno accesso a una finestra di contesto di 1 milione di token (~700.000 parole). Questo è in linea con il nuovo modello GenAI di Google, Gemini 1.5 Pro, che offre anche una finestra di contesto di un milione di token.

Limitazioni e miglioramenti futuri

Nonostante i miglioramenti apportati da Claude 3 rispetto ai modelli precedenti, Anthropic ammette che il modello non è immune dai problemi che affliggono gli altri modelli GenAI, come il bias e le “allucinazioni” (cioè inventare cose). A differenza di alcuni modelli GenAI, Claude 3 non può cercare informazioni sul web; i modelli possono solo rispondere alle domande utilizzando dati precedenti ad agosto 2023. Inoltre, sebbene Claude sia multilingue, non è altrettanto fluente in alcune lingue “a bassa risorsa” rispetto all’inglese.

Tuttavia, Anthropic promette frequenti aggiornamenti per Claude 3 nei prossimi mesi. L’azienda afferma: “Non riteniamo che l’intelligenza del modello abbia raggiunto i suoi limiti e abbiamo intenzione di rilasciare miglioramenti alla famiglia di modelli Claude 3 nel prossimo futuro”.

Disponibilità e prezzi

I modelli Claude 3 Opus e Sonnet sono già disponibili sul web e tramite la console e l’API di sviluppo di Anthropic, la piattaforma Bedrock di Amazon e l’IA di Vertex di Google. La variante Haiku sarà disponibile più avanti quest’anno.

Di seguito sono riportati i dettagli dei prezzi:

  • Opus: $15 per un milione di token di input, $75 per un milione di token di output
  • Sonnet: $3 per un milione di token di input, $15 per un milione di token di output
  • Haiku: $0,25 per un milione di token di input, $1,25 per un milione di token di output

Scopri di più da Syrus

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continua a leggere