TECNOLOGIA, INTERNET TRENDS, GAMING, BIG DATA

La superiorità di Claude 3.5 Sonnet di Anthropic rispetto a GPT-4o in molte valutazioni

La superiorità di Claude 3.5 Sonnet di Anthropic rispetto a GPT-4o in molte val...

By auroraoddi

Anthropic, l’azienda leader nell’intelligenza artificiale, ha recentemente lanciato il suo modello di medie dimensioni Claude 3.5 Sonnet, un’innovazione significativa che supera i concorrenti e persino il suo attuale modello di punta Claude 3 Opus in diverse valutazioni. Questo nuovo modello di IA è ora accessibile gratuitamente sulla piattaforma Claude.ai e sull’app iOS di Claude, con limiti di velocità più elevati per gli abbonati ai piani Claude Pro e Team. È inoltre disponibile attraverso l’API di Anthropic, Amazon Bedrock e Google Cloud’s Vertex AI.

Caratteristiche e prestazioni di Claude 3.5 Sonnet

Anthropic afferma che Claude 3.5 Sonnet “stabilisce nuovi standard del settore per il ragionamento di livello universitario (GPQA), la conoscenza di livello universitario (MMLU) e la competenza nella codifica (HumanEval)“. Il modello dimostra capacità migliorate nella comprensione della sfumatura, dell’umorismo e delle istruzioni complesse, oltre a eccellere nella produzione di contenuti di alta qualità con un tono naturale.

Funzionando a una velocità doppia rispetto a Claude 3 Opus, Claude 3.5 Sonnet è particolarmente adatto per compiti complessi come il supporto clienti sensibile al contesto e l’orchestrazione di flussi di lavoro multi-step. In una valutazione interna della codifica agenziale, ha risolto il 64% dei problemi, superando significativamente Claude 3 Opus al 38%.

Miglioramenti nelle capacità visive

Il modello Claude 3.5 Sonnet presenta anche capacità visive migliorate, superando Claude 3 Opus negli standard di valutazione visiva standard. Questo avanzamento è particolarmente evidente nei compiti che richiedono un ragionamento visivo, come l’interpretazione di grafici e tabelle. Claude 3.5 Sonnet può trascrivere accuratamente il testo da immagini imperfette, una funzionalità preziosa per settori come la vendita al dettaglio, la logistica e i servizi finanziari.

Artifacts: una nuova funzionalità per un’interazione più collaborativa

Insieme al lancio del modello, Anthropic ha introdotto Artifacts su Claude.ai, una nuova funzionalità che migliora l’interazione degli utenti con l’IA. Questa funzionalità consente agli utenti di visualizzare, modificare e costruire sul contenuto generato da Claude in tempo reale, creando un ambiente di lavoro più collaborativo.

Impegno di Anthropic per la sicurezza e la privacy

Nonostante il suo significativo balzo di intelligenza, Claude 3.5 Sonnet mantiene l’impegno di Anthropic per la sicurezza e la privacy. L’azienda afferma che “i nostri modelli sono sottoposti a test rigorosi e sono stati addestrati per ridurre gli usi impropri“.

Esperti esterni, tra cui l’Istituto di sicurezza dell’IA del Regno Unito (UK AISI) e gli esperti di sicurezza per i minori di Thorn, sono stati coinvolti nei test e nel perfezionamento dei meccanismi di sicurezza del modello.

Anthropic sottolinea inoltre il suo impegno per la privacy degli utenti, affermando di

“non addestrare i nostri modelli generativi sui dati inviati dagli utenti a meno che un utente non ci dia esplicito permesso di farlo. Finora non abbiamo utilizzato alcun dato del cliente o inviato dagli utenti per addestrare i nostri modelli generativi.”

Roadmap futura di Anthropic

Guardando al futuro, Anthropic prevede di rilasciare Claude 3.5 Haiku e Claude 3.5 Opus entro la fine di quest’anno per completare la famiglia di modelli Claude 3.5. L’azienda sta inoltre sviluppando nuove modalità e funzionalità per supportare più casi d’uso aziendali, incluse integrazioni con applicazioni aziendali e una funzionalità di memoria per esperienze utente più personalizzate.

Fonte dell’articolo qui.

Scopri di più da Syrus

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continua a leggere