Immagine di copertina per: Claude Sonnet 4.5: l-AI che lavora 30 ore senza sosta
Notizie

Claude Sonnet 4.5: l-AI che lavora 30 ore senza sosta

Foto di Cosmin Anton Mihoc Cosmin Anton Mihoc Ultima modifica: 30 settembre 2025 Lettura di 10 min

Anthropic Lancia Claude Sonnet 4.5: Rivoluzione nell'Intelligenza Artificiale

Anthropie ha presentato ufficialmente Claude Sonnet 4.5, il suo nuovo modello di intelligenza artificiale che ridefinisce gli standard del settore tecnologico. L'annuncio è arrivato lunedì 29 settembre 2025 e ha immediatamente catturato l'attenzione della comunità tech internazionale. La startup californiana, sostenuta da Amazon e valutata 183 miliardi di dollari, dichiara di aver creato il miglior modello al mondo per coding, agenti intelligenti e utilizzo diretto dei computer. Mike Krieger, Chief Product Officer di Anthropic, ha confermato che Claude Sonnet 4.5 diventerà il modello predefinito per tutti gli utenti, raccomandandolo per praticamente ogni caso d'uso. Il nuovo sistema rappresenta un salto evolutivo significativo rispetto ai predecessori, arrivando appena quattro mesi dopo il lancio di Claude Sonnet 4 e due mesi dopo Claude Opus 4.1, testimoniando il ritmo frenetico dell'innovazione nel campo dell'intelligenza artificiale.

Prestazioni Record: 30 Ore di Lavoro Autonomo Continuativo

La caratteristica più sorprendente di Claude Sonnet 4.5 è la sua capacità di lavorare autonomamente per oltre 30 ore consecutive su progetti complessi, mantenendo coerenza e produttività durante l'intero periodo. Questo rappresenta un miglioramento straordinario rispetto alle circa sette ore di lavoro continuativo garantite da Claude Opus 4 al momento del suo lancio. David Hershey, ricercatore AI di Anthropic, ha dichiarato a TechCrunch di aver osservato Claude Sonnet 4.5 programmare autonomamente per 30 ore durante i test iniziali con alcuni clienti enterprise. In quel periodo, il modello non si è limitato a costruire un'applicazione, ma ha anche configurato servizi database, acquistato nomi di dominio e persino eseguito un audit SOC 2 per garantire la sicurezza del prodotto. Durante un test interno particolarmente ambizioso, Claude ha scritto autonomamente 11.000 linee di codice per costruire un'applicazione di chat completa simile a Slack o Microsoft Teams, operando ininterrottamente per 30 ore. Un'impresa che rappresenta un salto quantico nelle capacità delle intelligenze artificiali moderne.

Benchmark e Confronti: Il Miglior Modello per Coding al Mondo

Anthropie supporta le sue affermazioni attraverso una serie di benchmark specifici che dimostrano la superiorità di Claude Sonnet 4.5. Sul SWE-bench Verified, il test che misura le abilità reali di programmazione software analizzando pull request su GitHub, il nuovo modello ha raggiunto uno straordinario 77.2% di successo (e 82% con parallel test-time compute). Ancora più impressionante è la performance su OSWorld, il benchmark che valuta le capacità dei modelli AI in attività informatiche pratiche su sistemi operativi reali. Claude Sonnet 4.5 ha stabilito un record con il 61.4% di successo, superando di 17 punti percentuali il precedente Opus 4.1 che si fermava al 42.2%. Appena quattro mesi fa, Sonnet 4 deteneva il primato con il 42.2%, evidenziando la rapidità dei progressi. Nei confronti diretti, Claude Sonnet 4.5 supera consistentemente i modelli concorrenti come GPT-5 di OpenAI e Gemini 2.5 Pro di Google nella maggior parte dei benchmark di programmazione. Michael Truell, CEO di Cursor, ha confermato: "Stiamo osservando prestazioni di coding all'avanguardia da Claude Sonnet 4.5, con miglioramenti significativi sui compiti a lungo orizzonte. Questo rafforza il motivo per cui molti sviluppatori che usano Cursor scelgono Claude per risolvere i loro problemi più complessi."

Sicurezza Potenziata: Il Modello Più Allineato di Anthropic

Un aspetto cruciale del nuovo modello è l'enfasi sulla sicurezza. Jared Kaplan, co-fondatore e Chief Science Officer di Anthropic, ha dichiarato che Claude Sonnet 4.5 rappresenta "il più grande salto in sicurezza degli ultimi 12-18 mesi". Il modello ha subito un addestramento estensivo per ridurre comportamenti problematici. Claude Sonnet 4.5 mostra tassi significativamente più bassi di sicofantismo, inganno, ricerca di potere e tendenza a incoraggiare il pensiero delirante rispetto ai modelli precedenti. Questi problemi hanno recentemente causato controversie per OpenAI, rendendo i miglioramenti di Anthropic particolarmente rilevanti. Il modello è anche più resistente agli attacchi di prompt injection, dove un'AI può essere ingannata per compiere azioni malevole come esporre dati sensibili. Anthropic ha implementato un sistema di classificazione avanzato che rileva potenziali rischi legati a contenuti pericolosi, rilasciando il modello sotto il framework AI Safety Level 3, con filtri progettati per prevenire output potenzialmente pericolosi relativi a armi chimiche, biologiche e nucleari.

Capacità Avanzate: Oltre la Semplice Programmazione

Claude Sonnet 4.5 eccelle non solo nella scrittura di codice, ma in una vasta gamma di applicazioni professionali. Il modello genera codice di qualità superiore, identifica meglio le opportunità di miglioramento e segue le istruzioni in modo più affidabile rispetto alle versioni precedenti. Nel campo della cybersecurity, team che utilizzano Sonnet 4.5 con Claude Code possono distribuire agenti che patchano autonomamente le vulnerabilità prima dello sfruttamento, passando da un approccio reattivo a uno proattivo nella difesa. Hai, azienda di sicurezza, ha riportato una riduzione del 44% nel tempo medio di gestione delle vulnerabilità, con un miglioramento del 25% nell'accuratezza. Per la finanza, il modello gestisce tutto, dall'analisi finanziaria di base all'analisi predittiva avanzata. Può monitorare continuamente i cambiamenti normativi globali e adattare preemptivamente i sistemi di conformità, evolvendosi oltre la preparazione manuale degli audit verso una gestione intelligente del rischio. Nel settore legale, Claude Sonnet 4.5 si dimostra all'avanguardia nei compiti di contenzioso più complessi, analizzando cicli completi di briefing, conducendo ricerche e sintetizzando eccellenti bozze preliminari di pareri per i giudici, o interrogando interi registri di contenzioso per creare analisi dettagliate per le sentenze sommarie.

Nuove Funzionalità e Strumenti per Sviluppatori

L'annuncio di Claude Sonnet 4.5 si accompagna a importanti aggiornamenti dell'ecosistema Claude. Claude Code, l'agente di programmazione dell'azienda, dispone ora di un'interfaccia terminale completamente rinnovata con la funzione dei checkpoint, una delle caratteristiche più richieste dagli utenti. I checkpoint permettono agli sviluppatori di salvare i progressi del lavoro e ripristinare uno stato precedente se il codice generato dall'AI non funziona correttamente. Quando si torna a un checkpoint, è possibile scegliere di ripristinare il codice, la conversazione o entrambi allo stato precedente. I checkpoint si applicano alle modifiche di Claude e non alle modifiche dell'utente o ai comandi bash, e si raccomanda di usarli in combinazione con il controllo di versione. È stata rilasciata anche un'estensione nativa per Visual Studio Code, permettendo agli sviluppatori di vedere in tempo reale le modifiche che Claude Code sta apportando con diff inline. L'interfaccia del terminale ha ricevuto aggiornamenti con migliore visibilità dello stato e una cronologia dei prompt ricercabile.

Claude Agent SDK: Costruire Agenti Personalizzati

Anthropie ha lanciato il Claude Agent SDK (precedentemente Claude Code SDK), che fornisce accesso agli stessi strumenti, sistemi di gestione del contesto e framework di permessi che alimentano Claude Code. Questo permette ai team di creare esperienze agentiche personalizzate utilizzando l'infrastruttura collaudata di Anthropic. Il SDK include accesso a macchine virtuali, gestione della memoria e supporto multi-agente migliorato. Anthropic afferma che Sonnet 4.5 è il primo modello rilasciato capace di ricostruire completamente l'applicazione web Claude.ai, un'operazione che ha richiesto circa cinque ore e mezza e ha coinvolto oltre 3.000 utilizzi di strumenti.

"Imagine with Claude": Software Generato al Volo

In un'iniziativa sperimentale affascinante, Anthropic ha lanciato "Imagine with Claude", disponibile esclusivamente per gli abbonati Claude Max per i prossimi cinque giorni. Questa anteprima di ricerca mostra il modello che genera software completamente al volo, rispondendo alle richieste dell'utente in tempo reale senza funzionalità predeterminate o codice prescritto. "Quello che vedi è Claude che crea in tempo reale, rispondendo e adattandosi alle tue richieste mentre interagisci", spiega Anthropic nel comunicato stampa. "È una dimostrazione divertente che mostra cosa può fare Claude Sonnet 4.5 - un modo per vedere cosa è possibile quando si combina un modello capace con l'infrastruttura giusta." Sebbene i dettagli tecnici su cosa accade in background mentre Claude costruisce queste applicazioni non siano ancora del tutto chiari, l'esperimento rappresenta un passo verso il concetto di software "usa e getta" che si crea quando serve.

Disponibilità e Prezzi: Accessibile a Tutti

Claude Sonnet 4.5 è disponibile da subito su tutte le piattaforme. Gli utenti possono chattare con Claude utilizzando Sonnet 4.5 su Claude.ai, disponibile su web, iOS e Android. Per gli sviluppatori interessati alla costruzione di agenti, Sonnet 4.5 è disponibile nativamente sulla Claude Developer Platform, oltre che su Amazon Bedrock e Google Cloud Vertex AI. Il modello è anche integrato in GitHub Copilot per utenti Pro, Pro+, Business ed Enterprise, portando i suoi miglioramenti significativi nel ragionamento multi-step e nella comprensione del codice alle esperienze agentiche di Copilot. I prezzi per gli sviluppatori rimangono invariati rispetto a Claude Sonnet 4: 3 dollari per milione di token di input (circa 750.000 parole, più dell'intera saga del "Signore degli Anelli") e 15 dollari per milione di token di output. Sono disponibili risparmi fino al 90% con la cache dei prompt e fino al 50% con l'elaborazione batch. Questo rappresenta un vantaggio competitivo significativo rispetto a Claude Opus (15/75 dollari), pur rimanendo più costoso di GPT-5 (1,25/10 dollari).

Reazioni dell'Industria e Adozione Enterprise

Le prime reazioni dall'industria tecnologica sono state estremamente positive. Jeff Wang, CEO di Windsurf, ha dichiarato che Claude Sonnet 4.5 rappresenta "una nuova generazione di modelli di coding", mentre aziende come Apple e Meta utilizzerebbero già i modelli Claude internamente. Canva ha riportato miglioramenti significativi nella gestione di compiti complessi e di lunga durata, dalla progettazione alla ricerca. Per Devin, l'assistente AI di programmazione, Claude Sonnet 4.5 ha aumentato le prestazioni di pianificazione del 18% e i punteggi di valutazione end-to-end del 12%, il più grande salto osservato dal rilascio di Claude Sonnet 3.6. Anthropie ha anche annunciato che Claude Code sta generando oltre 500 milioni di dollari di entrate annualizzate, con un utilizzo cresciuto di oltre 10 volte negli ultimi tre mesi, evidenziando la forte domanda di mercato per strumenti di AI coding avanzati.

Il Contesto Competitivo: Una Corsa all'Innovazione Senza Sosta

Il lancio di Claude Sonnet 4.5 si inserisce in un contesto di competizione feroce nel settore dell'intelligenza artificiale. Anthropic, fondata da ex ricercatori di OpenAI nel 2021, compete direttamente con l'azienda madre, che ha dato il via al boom dell'AI generativa con ChatGPT nel 2022 e ha recentemente lanciato GPT-5 con una valutazione aziendale lievitata a 500 miliardi di dollari. La tensione competitiva ha reso comune per le aziende rilasciare modelli di punta ogni pochi mesi, rendendo difficile per qualsiasi azienda mantenere un vantaggio significativo per molto tempo. Kaplan ha lasciato intendere che modelli ancora migliori sono all'orizzonte per Anthropic, incluso "molto probabilmente Opus", anche se ha aggiunto "senza promesse". Scott White, product lead di Anthropic, ha evidenziato un pattern significativo: ogni sei mesi il nuovo modello di Anthropic può gestire compiti che sono il doppio più complessi rispetto al predecessore. Questo ritmo di progresso rappresenta una continua evoluzione da assistente semplice a collaboratore, fino ad agente completamente autonomo capace di lavorare su orizzonti temporali estesi.

Il Mese Vincente di Anthropic

Il rilascio di Claude Sonnet 4.5 corona un settembre di successi per Anthropic. Solo pochi giorni prima, Microsoft aveva aggiunto i modelli Claude a Copilot 365, e in un riconoscimento particolarmente significativo, OpenAI stessa ha ammesso che il rivale offre la migliore AI per compiti legati al lavoro. Questa serie di vittorie posiziona Anthropic come player sempre più centrale nell'ecosistema dell'intelligenza artificiale enterprise. Con il supporto finanziario di Amazon, partnership strategiche con giganti tech come Microsoft e Google, e una valutazione in costante crescita, l'azienda si sta affermando come alternativa credibile e spesso preferibile a OpenAI per applicazioni professionali.

Prospettive Future: Verso Agenti Veramente Autonomi

Le capacità dimostrate da Claude Sonnet 4.5 aprono scenari affascinanti per il futuro dell'automazione lavorativa. La possibilità di agenti AI che operano autonomamente per giorni interi su progetti complessi sblocca il potenziale per gestire compiti ambiziosi che fino a ieri richiedevano team umani dedicati. "Questa è una continua evoluzione di Claude, da assistente a più collaboratore, fino ad agente completamente autonomo capace di lavorare su orizzonti temporali estesi", ha spiegato White. La capacità di operare senza sosta per lunghi periodi costituisce un passo evolutivo fondamentale per l'integrazione tra intelligenza artificiale e pianificazione pluriennale. Tuttavia, come sempre nel campo dell'AI, le promesse dovranno essere verificate sul campo. L'adozione su larga scala e l'uso prolungato in contesti produttivi diversi forniranno dati più solidi sull'affidabilità effettiva del sistema. I primi segnali sono decisamente incoraggianti, ma l'industria tecnologica ha imparato a valutare i modelli di intelligenza artificiale sulla base di risultati concreti e misurabili nel tempo. Con Claude Sonnet 4.5, Anthropic non si limita a incrementare le prestazioni: sta ridefinendo cosa significa per un'intelligenza artificiale essere un vero partner di lavoro, capace non solo di assistere ma di portare avanti autonomamente progetti complessi dall'inizio alla fine. Resta da vedere quanto velocemente l'industria adotterà questa nuova generazione di strumenti e come evolverà il rapporto tra sviluppatori umani e assistenti AI sempre più capaci.

Unisciti al gruppo Telegram del Cilento! Entra nel gruppo Telegram

Ti è piaciuto questo articolo? Condividilo!

Commenti