Anthropic presenta Claude Sonnet 4.6, offrendo prestazioni quasi pari a quelle di un'opera e funzionalità di contesto esteso
In Breve
Claude Sonnet 4.6 di Anthropic introduce un importante aggiornamento che offre prestazioni prossime a quelle di Opus, capacità di codifica e utilizzo del computer più potenti e una finestra di contesto da un milione di token a tutti gli utenti, allo stesso prezzo della versione precedente.
Azienda di ricerca e sicurezza sull'intelligenza artificiale Antropico ha annunciato l'introduzione di Claude Sonnet 4.6, descritto come il suo modello Sonnet più potente fino ad oggi. La release si presenta come un aggiornamento completo per quanto riguarda la codifica, l'uso del computer, il ragionamento a contesto lungo, la pianificazione degli agenti, il knowledge work e la progettazione, con una finestra di contesto da un milione di token disponibile in versione beta. Per gli utenti con piani Free e Pro, Sonnet 4.6 diventa il modello predefinito in claude.ai e Claude Cowork, con prezzi invariati rispetto a Sonnet 4.5.
L'aggiornamento si propone come un passo avanti che offre prestazioni di fascia alta a un pubblico più ampio. Gli sviluppatori che hanno testato il modello in fase iniziale hanno segnalato che i miglioramenti in termini di coerenza, capacità di seguire le istruzioni e comprensione contestuale lo hanno reso preferibile non solo a Sonnet 4.5, ma, in molti casi, anche al modello più avanzato Opus 4.5 di Anthropic, in uscita a fine 2025. Le attività che in precedenza richiedevano un sistema di classe Opus, in particolare quelle legate ai flussi di lavoro d'ufficio reali, sono ora presentate come realizzabili con Sonnet 4.6. L'azienda evidenzia inoltre un notevole balzo in avanti nelle capacità di utilizzo del computer, un'area in cui i precedenti modelli Sonnet erano in ritardo.
Anthropic sottolinea che il modello è stato sottoposto ad approfondite valutazioni di sicurezza. I ricercatori interni hanno descritto Sonnet 4.6 come un modello che dimostra solidi comportamenti di sicurezza e nessun segno significativo di disallineamento ad alto rischio, un punto che l'azienda utilizza per rafforzare il suo posizionamento più ampio sullo sviluppo responsabile dell'intelligenza artificiale.
La discussione sulle capacità di utilizzo del computer riflette un dibattito più ampio sul valore dei sistemi di intelligenza artificiale in grado di gestire il software direttamente anziché tramite API. Anthropic osserva che molte organizzazioni si affidano a strumenti obsoleti che non possono essere facilmente automatizzati e che un modello in grado di interagire con un computer come un essere umano può ridurre la necessità di integrazioni personalizzate.
Benchmark come OSWorld, che simulano ambienti software reali, mostrano miglioramenti costanti nei sedici mesi di sviluppo di Sonnet. I primi utenti di Sonnet 4.6 segnalano che il modello è ora in grado di gestire attività come la navigazione di fogli di calcolo complessi o la compilazione di moduli web multi-step a un livello prossimo alla competenza umana, sebbene sia ancora in ritardo rispetto agli utenti esperti. Allo stesso tempo, l'azienda riconosce rischi come gli attacchi di prompt injection e afferma una maggiore resistenza rispetto alle versioni precedenti.
Sonnet 4.6 migliora la qualità del codice, il ragionamento e l'uso degli strumenti
Oltre all'uso del computer, Anthropic segnala ampi miglioramenti nei benchmark. In Claude Code, gli utenti hanno preferito Sonnet 4.6 a Sonnet 4.5 nella maggior parte dei test, citando una migliore lettura del contesto, una riduzione delle duplicazioni e un'esecuzione multi-step più affidabile. Molti lo hanno anche preferito a Opus 4.5, descrivendolo come meno incline all'overengineering e più coerente nel seguire le istruzioni. La finestra di contesto estesa consente al modello di funzionare su intere basi di codice o su ampie raccolte di ricerca, e Anthropic ne evidenzia le prestazioni nella simulazione Vending-Bench Arena, dove il modello ha adottato una strategia di investimento a lungo termine che ha superato i concorrenti.
L'azienda sottolinea che i primi clienti hanno riscontrato miglioramenti in aree quali lo sviluppo frontend, l'analisi finanziaria e la qualità del design visivo. Sonnet 4.6 include anche aggiornamenti per la piattaforma e le API di Claude Developer, tra cui modalità di pensiero adattivo ed esteso, compattazione del contesto, elaborazione migliorata della ricerca web e funzionalità estese per l'utilizzo degli strumenti. Il modello è ora disponibile per tutti i piani Claude, incluso il livello gratuito, ed è accessibile tramite Claude Cowork, Claude Code, l'API e le principali piattaforme cloud.
Negazione di responsabilità
In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.
Circa l'autore
Alisa, una giornalista dedicata al MPost, è specializzato in criptovalute, IA, investimenti e nell'ampio regno di Web3. Con un occhio attento alle tendenze e alle tecnologie emergenti, offre una copertura completa per informare e coinvolgere i lettori nel panorama in continua evoluzione della finanza digitale.
Altri articoli
Alisa, una giornalista dedicata al MPost, è specializzato in criptovalute, IA, investimenti e nell'ampio regno di Web3. Con un occhio attento alle tendenze e alle tecnologie emergenti, offre una copertura completa per informare e coinvolgere i lettori nel panorama in continua evoluzione della finanza digitale.



