Colpo di scena nell’IA: Trump blocca l’accesso al modello più avanzato di Claude
Gli Stati Uniti impongono lo stop per presunti rischi alla sicurezza nazionale. L’azienda accusa la Casa Bianca di aver preso una decisione sproporzionata e priva di basi tecniche sufficienti ed afferma di star lavorando per ripristinare l’accesso.
Il governo degli Stati Uniti ha ordinato ad Anthropic di sospendere immediatamente l’accesso ai modelli Fable 5 e Mythos 5 per tutti i cittadini stranieri, sia all’interno sia all’esterno degli Stati Uniti, compresi i dipendenti stranieri della stessa Anthropic. Per rispettare la direttiva, in assenza di strumenti in grado di discriminare la nazionalità dei clienti, l’azienda ha deciso di disattivare completamente i due modelli per tutti i suoi clienti. Gli altri modelli Anthropic continueranno invece a funzionare normalmente.
Secondo Anthropic, l’ordine è arrivato alle 17:21 (ora della costa orientale americana) e non contiene dettagli specifici sulle preoccupazioni di sicurezza nazionale che hanno motivato il provvedimento. L’azienda ritiene che il governo sia venuto a conoscenza di una tecnica di “jailbreak”, cioè un metodo per aggirare le protezioni di sicurezza del modello. Dopo aver esaminato una dimostrazione di questa tecnica, Anthropic sostiene che essa permetta soltanto di individuare alcune vulnerabilità minori già note e che risultati simili possano essere ottenuti anche con altri modelli disponibili pubblicamente.
Anthropic difende il sistema di sicurezza implementato su Fable 5, ricordando di aver sottoposto il modello a migliaia di ore di test insieme al governo statunitense, all’istituto britannico per la sicurezza dell’intelligenza artificiale, a organizzazioni private e a team interni. Secondo questi test, le protezioni di Fable sarebbero significativamente più efficaci rispetto a quelle dei modelli precedenti e nessuno sarebbe ancora riuscito a trovare un “jailbreak universale”, cioè una tecnica capace di aggirare in modo ampio e sistematico tutte le difese del modello.
L’azienda riconosce che una resistenza perfetta ai jailbreak probabilmente non è possibile per nessun produttore di IA. Per questo ha adottato una strategia di “difesa in profondità”: rendere i jailbreak limitati o molto costosi da sviluppare, monitorare costantemente gli utilizzi e intervenire rapidamente in caso di abuso. In quest’ottica Anthropic ha anche introdotto una conservazione dei dati degli utenti per 30 giorni, proprio per facilitare l’individuazione e la mitigazione di eventuali tentativi di aggiramento delle protezioni.
Anthropic afferma inoltre di non aver ricevuto alcuna segnalazione di un jailbreak che abbia causato danni concreti. L’unica prova mostrata verbalmente dal governo riguarderebbe un metodo molto specifico che consiste nel chiedere al modello di analizzare un codice sorgente e correggerne eventuali vulnerabilità software. Secondo l’azienda, il livello di capacità dimostrato da questo test è ampiamente disponibile anche in altri modelli avanzati, compreso GPT-5.5 della rivale OpenAI, ed è utilizzato quotidianamente da professionisti della cybersicurezza per difendere i sistemi informatici.
Pur dichiarando di rispettare l’ordine governativo, Anthropic contesta la decisione. A suo avviso, la scoperta di un possibile jailbreak limitato non giustifica il ritiro di un modello commerciale utilizzato da centinaia di milioni di persone. Se questo criterio fosse applicato a tutta l’industria, sostiene l’azienda, finirebbe per bloccare di fatto il lancio di nuovi modelli di frontiera da parte di tutti i principali sviluppatori di intelligenza artificiale.
Anthropic conclude affermando di essere favorevole a un sistema in cui il governo possa bloccare modelli ritenuti realmente pericolosi, ma solo attraverso procedure trasparenti, chiare, basate su fatti tecnici verificabili e previste dalla legge. Secondo l’azienda, l’azione intrapresa in questo caso non rispetta tali principi. Per questo ritiene che si tratti di un malinteso e dichiara di stare lavorando per ripristinare l’accesso a Fable 5 e Mythos 5 il prima possibile.