Anthropic, una startup di intelligenza artificiale specializzata nella creazione di modelli di IA affidabili per competere con ChatGPT di OpenAI LP, ha annunciato oggi un aggiornamento del suo chatbot Claude che introduce importanti miglioramenti in termini di sicurezza, la possibilità di gestire finestre contestuali più ampie e una nuova funzionalità di utilizzo di strumenti di terze parti.
Claude 2.1: un chatbot avanzato
La nuova versione, Claude 2.1, rappresenta un miglioramento rispetto a Claude 2 ed è un chatbot di IA generativa in grado di comprendere istruzioni conversazionali in linguaggio naturale. Claude può assistere gli utenti in molteplici modi, fornendo commenti, risposte a domande, supporto nella ricerca, creazione di poesie, analisi e riassunto di documenti lunghi, inclusi PDF, nonché assistenza nella scrittura di codice. Claude può essere considerato come un assistente personale amichevole in grado di interagire con gli utenti tramite istruzioni in linguaggio naturale.
Finestre contestuali più ampie
Rispetto a Claude 2, Anthropic ha raddoppiato la finestra contestuale di Claude 2.1, portandola a 200.000 token, corrispondenti a circa 150.000 parole o più di 500 pagine di materiale. Gli utenti possono ora caricare ampie porzioni di documentazione, compresi interi codici sorgente, bilanci finanziari o addirittura opere letterarie lunghe come “Iliade” o “Odissea”, che contengono rispettivamente 176.000 e 115.320 parole.
Una volta acquisito il materiale, Claude può “dialogare” con grandi quantità di contenuti o dati, riassumere, svolgere sessioni di domande e risposte, prevedere tendenze, confrontare e analizzare diversi documenti. Questa capacità di elaborare messaggi così lunghi rappresenta una “complessità unica nel settore” e un risultato mai raggiunto prima. Attività che richiederebbero ore di lavoro umano possono ora essere completate da Claude in pochi minuti.
Maggiore sicurezza e affidabilità dei modelli
Anthropic ha compiuto importanti progressi per migliorare la sicurezza complessiva del modello, riducendo al minimo le “allucinazioni” o le affermazioni false rispetto a Claude 2.0. Ciò consente alle aziende che si basano su questo modello di utilizzare l’IA ad alte prestazioni per risolvere problemi che richiedono maggiore affidabilità e fiducia, con la certezza di ricevere informazioni più accurate.
Claude 2.1 è stato sottoposto a test molto impegnativi, con domande che erano altamente probabili di mettere in difficoltà i modelli attuali, inducendoli a fornire affermazioni false invece di ammettere di non sapere. In questi test, Claude 2.1 ha dimostrato di essere molto più propenso a rifiutare di rispondere, con una riduzione del 50% delle affermazioni false rispetto alla versione precedente. Inoltre, durante le valutazioni interne, Claude 2.1 ha evidenziato una riduzione del 30% delle risposte errate quando si tratta di leggere documenti complessi e lunghi, come report legali o documenti finanziari.
Integrazione di strumenti di terze parti
In risposta al feedback degli utenti, Anthropic ha introdotto una nuova funzionalità in fase di test beta che consente a Claude di accedere a processi, prodotti e interfacce di programmazione di terze parti. I developer possono ora interagire con il chatbot utilizzando funzioni personalizzate che il bot utilizzerà quando necessario per completare le richieste. Ciò include funzioni create dai developer stessi, ricerche su Internet, basi di conoscenza private e strumenti di terze parti.
Ad esempio, Claude può collegarsi a un calcolatore per risolvere problemi numerici complessi, rispondere a una domanda utilizzando una chiamata API o effettuare una ricerca su Internet, eseguire un’operazione tramite una chiamata API privata, come nel caso di un sistema di gestione dei contenuti, o connettere gli utenti a un insieme di dati di prodotto per fornire raccomandazioni.
I developer ora hanno un accesso più semplice ai prompt di test tramite il Workbench, disponibile nella console per sviluppatori. Il Workbench consente ai developer di sperimentare prompt in un ambiente simile a un playground per testare il comportamento di Claude con nuove impostazioni del modello. Consente inoltre di salvare tentativi di revisione diversi, che possono essere ripresi in seguito. Successivamente, i developer possono generare frammenti di codice da utilizzare nelle proprie applicazioni utilizzando i kit di sviluppo software di Anthropic.
Istruzioni personalizzate per Claude
Una nuova tipologia di istruzioni chiamata “system prompts” consente ai developer di fornire istruzioni personalizzate a Claude per farlo agire in modi specifici o assumere determinate personalità o ruoli. Utilizzando i system prompts, i developer possono impostare Claude in modo che si comporti in determinati modi, utilizzando un tono particolare, limitandosi a specifici argomenti e rispettando determinate regole. Utilizzando questo tipo di prompt, Claude sarà meno propenso a eseguire azioni proibite o a produrre testo indesiderato e si manterrà maggiormente nel ruolo che gli è stato assegnato.

