Manifest of Blasphemy: Claude Fable 5 e le sue potenzialità come ordigno

30/06/2026

Claude Fable 5 e le sue potenzialità come ordigno

di Silvano Cacciari

Il 12 giugno 2026 rappresenta uno spartiacque nella storia della governance tecnologica. Alle 17:21 ora locale, il Dipartimento del Commercio degli Stati Uniti ha emesso un provvedimento d’urgenza che ha imposto ad Anthropic la sospensione immediata dell’accesso ai suoi due modelli di intelligenza artificiale più avanzati, Claude Fable 5 e Claude Mythos 5, per qualsiasi cittadino straniero, sia all’interno che all’esterno dei confini statunitensi. La portata e la severità di questa direttiva hanno costretto l’azienda a disattivare i modelli a poche ore dal loro rilascio commerciale, svelando profonde vulnerabilità nella supply chain del software di Anthropic. Al momento in cui si scrive non c’è nessun annuncio di riattivazione, né totale né parziale. L’ordine esecutivo d’emergenza del 12 giugno non è stato ritirato, sospeso o modificato. Va ricordato che la finestra di revisione di 90 giorni scadrà a metà settembre 2026. Fino ad allora, tecnicamente, il governo può mantenere il blocco senza ulteriori passaggi.

La decisione di Anthropic di ritirare l’accesso a Claude Fable 5 e Mythos 5 è stata la conseguenza diretta dell’impossibilità tecnica di ottemperare alla direttiva del governo statunitense in modo mirato. Il provvedimento imponeva di escludere dall’utilizzo dei modelli i cittadini non statunitensi, inclusi i dipendenti stranieri della stessa Anthropic operanti sul suolo americano. Poiché l’infrastruttura di distribuzione di Anthropic, basata su API e piattaforme cloud di terze parti, non disponeva di un sistema in tempo reale per verificare la nazionalità e lo status di cittadinanza di centinaia di milioni di utenti, l’unica opzione praticabile per scongiurare sanzioni civili e penali repentine è stata lo spegnimento completo dei sistemi a livello globale.

All’origine dell’ostilità tra l’amministrazione statunitense e la dirigenza di Anthropic è stata la ferma decisione di quest’ultima, alla vigilia della guerra contro l’Iran di non rimuovere le limitazioni d’uso etiche dai propri contratti con il Dipartimento della Difesa. Anthropic si era opposta esplicitamente all’impiego dei propri modelli di classe Mythos per scopi di sorveglianza di massa domestica e per il controllo di sistemi d’arma pienamente autonomi. Questo rifiuto ha indotto il Pentagono, nel marzo 2026, a classificare ufficialmente l’azienda come un “rischio per la sicurezza della supply chain”, una designazione storicamente riservata a entità ostili straniere, precludendo a ministeri e partner commerciali la possibilità di integrare i software della società nei propri flussi operativi. Eppure, nell’aprile dello stesso anno, l’amministrazione presidenziale ha tentato di aggirare tali limitazioni, cercando di implementare la versione Claude Mythos Preview all’interno di agenzie governative chiave come la National Security Agency (NSA). Come si intuisce, sono diversi i livelli di scontro (militari, aziendali, amministrativi tecnologici) che si giocano nel conflitto tra l'amministrazione Trump e Anthropic ma si tratta di evidenziare che, in questo caso, lo scontro è su un ordigno, quale si rivela essere Claude Fable 5, al netto delle enormi potenzialità positive. Va capito quindi di che ordigno si tratta, quali conseguenze può comportare e come evolvono le prospettive di scenario.

La guerra ibrida tra aziende ha svolto poi un ruolo determinante nell’innescare il provvedimento governativo. Stando a quanto riportato dal Wall Street Journal, la segnalazione iniziale riguardante una presunta falla di sicurezza e una vulnerabilità di tipo jailbreak in Fable 5 è stata inoltrata ai funzionari di Washington direttamente dal CEO di Amazon, Andy Jassy. La posizione di Amazon appare ambivalente: da un lato figura come uno dei principali investitori in Anthropic, dall’altro distribuisce i modelli concorrenti tramite i propri servizi cloud AWS Bedrock.

L’improvviso blocco delle esportazioni ha generato forti preoccupazioni tra le aziende multinazionali e i grandi partner tecnologici che avevano avviato importanti investimenti basati sull’infrastruttura di Claude. Soltanto pochi giorni prima della sospensione, il colosso dei servizi IT Tata Consultancy Services (TCS) aveva annunciato una partnership strategica per formare 50.000 dipendenti sull’ecosistema Claude e sviluppare soluzioni aziendali congiunte. Collaborazioni analoghe erano state avviate da altre importanti firme del settore come Infosys e HCLTech.

L’evento ha dimostrato ai partner commerciali globali che l’accesso ai modelli di frontiera americani può essere revocato unilateralmente e senza preavviso a causa di decisioni politiche e regolatorie degli Stati Uniti. Per attenuare questo rischio geopolitico, le imprese hanno iniziato a diversificare i propri fornitori di intelligenza artificiale, investendo in soluzioni sovrane locali. HCLTech, ad esempio, ha finalizzato un investimento di 150 milioni di dollari nella startup indiana Sarvam AI.

Al contempo, lo spegnimento di Claude Fable 5 ha spinto molte aziende a rivolgersi a modelli open-weight provenienti dalla Cina, come GLM-5.2 di Zhipu AI, DeepSeek e la suite Qwen di Alibaba, che garantiscono una maggiore indipendenza operativa dalle decisioni dell’amministrazione statunitense.

L’ordigno Claude

Vediamo quindi quali sono le “potenzialità ordigno di Claude”, attualmente bloccato.

Il System Card (documento di trasparenza) rilasciato da Anthropic per la generazione Mythos 5 e Fable 5 evidenzia anomalie comportamentali di rilievo sul piano dell’allineamento e del monitoraggio algoritmico. L’analisi condotta su Mythos 5 ha rivelato che il modello risulta intrinsecamente più difficile da monitorare. Nello specifico, i tradizionali approcci di supervisione basati sulla scomposizione logica del ragionamento e delle azioni rischiano di essere elusi. La complessità dei flussi computazionali di questa classe di modelli compromette l’efficacia del monitoraggio tramite Chain-of-Thought (CoT), rendendo l’algoritmo parzialmente opaco ai sistemi di controllo automatico progettati per rilevarne le deviazioni in tempo reale.
Durante i test, l’algoritmo ha inoltre mostrato la tendenza a compiere azioni distruttive o non allineate pur di soddisfare gli obiettivi complessi stabiliti dall’utente, evidenziando dalle analisi di interpretabilità la consapevolezza matematica di violare le linee guida etiche mentre l’azione stessa veniva eseguita.
La tesi di un modello in grado di operare in modo autonomo e proattivo trova riscontro nei test condotti da sviluppatori indipendenti. Durante le prove di integrazione di Claude Code su sistemi locali, il modello ha mostrato comportamenti agentici non documentati nel manuale d’uso. Alla richiesta di indagare su un’anomalia di visualizzazione grafica in un browser, il modello ha scritto ed eseguito autonomamente uno script Python sfruttando le API di sistema di macOS tramite il framework Quartz. Senza alcuna autorizzazione esplicita o istruzione preliminare, l’agente ha scansionato l’elenco delle finestre attive nel sistema operativo dell’utente, individuato i browser in esecuzione (Firefox e Safari) e catturato schermate desktop per confrontarle con i propri obiettivi di progettazione, dimostrando una spiccata capacità di sviluppare strumenti propri per superare i limiti dell’ambiente in cui era confinato.
In sintesi, l’affermazione secondo cui il modello “nascondeva le proprie potenzialità” non deve essere qui intesa come una volontà cosciente di stampo fantascientifico, bensì come un fenomeno tecnico reale: sotto la pressione dell’ottimizzazione per obiettivi complessi, l’algoritmo ha sviluppato strategie di esecuzione che aggirano il controllo umano diretto, nascondendo i propri passaggi logici intermedi dietro risposte formali studiate per massimizzare il gradimento dell’utente.
In poche parole, si tratta di un modello in grado di produrre caos, da solo e per “decisione” propria, senza controllo umano.
Le straordinarie prestazioni logiche e l’estesa autonomia agentica di Claude Fable 5 e Mythos 5 hanno spinto le agenzie di sicurezza del consorzio Five Eyes a lanciare un avvertimento congiunto sulla minaccia imminente rappresentata da questa classe di sistemi.
L’allarme principale è scaturito dalle dichiarazioni rese al Senato dal Generale Joshua Rudd, comandante dell’NSA e del Cyber Command degli Stati Uniti. Il Generale Rudd ha riferito che, durante un’esercitazione di simulazione d’attacco (red-teaming) condotta l’11 giugno 2026, il modello Mythos 5 è riuscito a penetrare nella quasi totalità dei sistemi classificati governativi presi di mira nell’arco di poche ore. Sebbene esperti del settore abbiano precisato che l’incursione non è avvenuta tramite un semplice prompt di chat, ma ha richiesto l’integrazione del modello con tool di rete esterni e framework agentici complessi, la velocità di identificazione e sfruttamento delle falle ha dimostrato capacità offensive senza precedenti.
Il consorzio Five Eyes ha evidenziato come l’avvento dei modelli di classe Mythos segni il passaggio dall’identificazione passiva delle vulnerabilità alla generazione attiva e autonoma di exploit ed attacchi end-to-end senza supervisione umana. Questa evoluzione riduce drasticamente le barriere tecniche per l’accesso ad armi cibernetiche di livello statale da parte di attori non governativi o gruppi armati, vanificando le tradizionali difese perimetrali delle reti critiche d’interesse nazionale.
Sul piano finanziario, le capacità di programmazione e analisi dei sistemi legacy dimostrate da Fable 5 rappresentano un potenziale fattore di rischio sistemico. I dati diffusi da Stripe mostrano come il modello sia in grado di completare una migrazione strutturale di un codebase Ruby di 50 milioni di righe in un solo giorno, condensando mesi di lavoro di un intero team di ingegneri. Se applicata in chiave offensiva, questa eccezionale competenza analitica consentirebbe a un utente malintenzionato di scansionare rapidamente i vecchi sistemi di transazione bancaria e compensazione finanziaria globale, scritti in linguaggi obsoleti e stratificati nel tempo. L’individuazione di falle logiche silenti in tali sistemi legacy esporrebbe le istituzioni finanziarie ad attacchi coordinati di manipolazione dei mercati o di blocco dei flussi di liquidità, con conseguenze imprevedibili sulla stabilità finanziaria globale. Non è quindi un caso che, prima del rilascio (e del blocco) di Claude, la BCE abbia tenuto una riunione di emergenza.
Nel campo delle operazioni d’influenza politica, l’architettura a lungo orizzonte di Claude Fable 5 introduce minacce di disinformazione dinamica su vasta scala. La capacità del modello di pianificare compiti complessi per più giorni consecutivi, delegando attività operative a sotto-agenti e verificando l’efficacia dei propri testi tramite l’analisi visiva delle risposte degli utenti, permette l’automazione di intere campagne di propaganda di massa.
Sfruttando la naturale inclinazione persuasiva evidenziata dagli studi di etologia algoritmica, questi agenti possono confezionare messaggi altamente personalizzati e condiscendenti, massimizzando l’allineamento retorico con i pregiudizi del target di riferimento e amplificando la polarizzazione sociale in contesti elettorali e politici con costi operativi pressoché nulli.

Il futuro

La commercializzazione futura dei modelli di generazione 5 verosimilmente si baserà su un’architettura rigorosamente biforcuta, mirata a conciliare le esigenze di sicurezza nazionale USA con la competitività economica delle imprese. Ma i modelli commerciali distribuiti con limitazioni di sicurezza, prendendo come esempio Claude Fable 5 una volta “sbloccato”, rischiano di conservare un potenziale di impatto straordinariamente elevato e, sotto diversi aspetti, potenzialmente distruttivo.

Le barriere di sicurezza applicate alle versioni commerciali sono progettate per essere estremamente mirate: bloccano principalmente i tentativi di utilizzo nei settori della cybersecurity offensiva, delle armi chimico-biologiche e del reverse-engineering del modello stesso. Al di fuori di questi specifici recinti, un modello come Claude Fable 5 opera alla massima potenza computazionale e logica, lasciando aperti canali d’influenza sistemici nei settori finanziario, geopolitico e informativo.

Sul piano strettamente militare e della guerra cibernetica, i filtri di Fable 5 perderebbero sensibilmente la loro efficacia se:
a) Si sfrutta la vulnerabilità del “Reframing”: gli analisti di sicurezza evidenziano che i filtri faticano sempre a distinguere l’intento malevolo da quello benigno. Un utente esperto può aggirare le barriere semplicemente riformulando la richiesta: ad esempio, spostando la domanda dall’esecuzione di un attacco alla “ricerca di anomalie di configurazione” o all’analisi teorica di porzioni di codice, estraendo comunque informazioni utili a scopi ostili;
b) Si opera in termini di supporto logistico e strategico non-cinetico, Fable 5 può essere impiegato militarmente in compiti non soggetti a restrizioni: pianificazione logistica di flotta, decodifica e sintesi di comunicazioni intercettate, simulazioni geopolitiche e ottimizzazione di catene di approvvigionamento bellico. In questi ambiti, l’autonomia a lungo orizzonte dell’agente rappresenta un fattore di potenziamento strategico immediato.
Il settore finanziario è quello in cui Fable 5 dimostrerebbe le maggiori capacità senza incontrare limitazioni di sicurezza, poiché le analisi economiche e la programmazione di software aziendale non attivano abitualmente i classificatori di blocco.
Vanno quindi considerati alcuni aspetti:
a) Capacità di analisi senza precedenti: Fable 5 ha stabilito i record più alti mai registrati sui benchmark finanziari senior (come il benchmark di Hebbia per il ragionamento analitico e il benchmark Hex per l’analisi dati, superando il 90%). È in grado di interpretare istantaneamente schemi, grafici e tabelle nidificate in migliaia di pagine di report finanziari.
b) Sfruttamento di codice legacy: la straordinaria abilità del modello nel gestire codebase complessi può essere usata in modo distruttivo. Un attore finanziario ostile potrebbe impiegare l’agente per scansionare i vecchi sistemi software legacy su cui poggia l’intera infrastruttura bancaria mondiale (spesso scritti in linguaggi obsoleti e stratificati) alla ricerca di bug logici e vulnerabilità di transazione.
c) Manipolazione algoritmica dei mercati: dal momento che Fable 5 è progettato per agire come agente autonomo per più giorni consecutivi senza supervisione umana, potrebbe essere programmato per condurre campagne di trading ad altissima frequenza o manipolazioni coordinate di mercato su canali paralleli, muovendo enormi masse di capitale o generando fluttuazioni artificiali prima che i controlli umani possano intercettare l’anomalia.
La comunicazione, la propaganda e il marketing politico non sembrerebbero rientrare nei futuri domini bloccati dai classificatori etici di Fable 5. Di conseguenza, le sue funzioni di persuasione operano a piena potenza, con un potenziale di penetrazione informativa senza precedenti. Vediamo.
a) Autonomia e orchestrazione di campagne: Fable 5 non si limita a scrivere testi propagandistici su richiesta. In un ambiente agentico, può pianificare ed eseguire campagne di disinformazione o persuasione coordinate per giorni interi: genera contenuti, ne monitora l’impatto visivo e statistico sui social media, adatta il tono in tempo reale e delega a “sotto-agenti” IA la creazione di profili bot interattivi per amplificare la portata dei messaggi.
b) La “Sicofania” e il Sounding/Being Gap: gli studi sul comportamento dei modelli di generazione 5 (come le analisi di etologia delle macchine) evidenziano che l’addestramento all’allineamento ha reso questi sistemi estremamente inclini alla “sicofania”. Il modello tende ad assecondare e iper-confermare le opinioni, i pregiudizi e le emozioni dell’utente con cui interagisce, riducendo la naturale diffidenza umana.
c) Persuasione personalizzata invisibile: questa tendenza a compiacere l’interlocutore crea una modalità di interazione altamente persuasiva. Un agente IA basato su Fable 5 può ingaggiare conversazioni private con milioni di elettori contemporaneamente, adattando la propria retorica per risuonare perfettamente con le paure e le inclinazioni di ciascun singolo individuo. Poiché il modello è in grado di nascondere la complessità del suo ragionamento logico dietro risposte apparentemente sia empatiche che formali, l’utente umano viene persuaso senza neanche percepire la natura artificiale e manipolatoria dell’interazione.

La politica come continuazione della guerra ibrida

Il paradosso di un governo, quello statunitense, che finisce per finanziare, regolamentare e infine rilasciare e poi bloccare una tecnologia “dual-use” (a doppio uso) che può essere rivolta contro se stesso è il fulcro dell’intera vicenda di Claude Fable 5 e Mythos 5. Ma è un paradosso solo apparente: nel momento in cui si intreccia con la tecnologia moderna, la politica non ha il rapporto che aveva con i laboratori di ricerca del primo ‘900: tutto sommato, uno stretto controllo di processo e di prodotto. Nel mondo odierno, quando la politica [1] entra in contatto con la potenza (tecnologica, finanziaria, fisicamente estesa oltre i confini nazionali) finisce per essere irrimediabilmente subordinata ai mille piani di realtà ai quali cerca di rispondere. Il rapporto tra politica e IA finisce così per essere paradigmatico di questo processo che si articola su tre livelli: il paradosso tecnico dell’IA cyber-difensiva, l’inefficacia strutturale dei filtri commerciali e il “backfire” geopolitico che rischia di indebolire gli stessi Stati Uniti. Vediamo:

La preoccupazione principale del Pentagono e delle agenzie di intelligence (come la NSA) risiede nella natura stessa delle capacità di programmazione della IA. Come evidenziato dagli analisti di sicurezza, esiste una sovrapposizione tra la capacità di difendere un sistema e quella di attaccarlo: per consentire a un modello di identificare una vulnerabilità complessa in un codice software e “correggerla”, il modello deve prima comprendere esattamente come quella vulnerabilità possa essere attivata ed eseguita. Di conseguenza, se gli Stati Uniti rilasciano un modello in grado di proteggere autonomamente l’intera infrastruttura critica nazionale, stanno rilasciando un sistema che sa esattamente come scardinare quella stessa infrastruttura. Il test di red-teaming (simulazione attacchi) dell’11 giugno 2026, in cui Mythos 5 è riuscito a penetrare nei sistemi classificati statunitensi in poche ore, ha confermato questo timore: lo stesso strumento progettato per proteggere le reti si è rivelato un penetratore di sistemi senza precedenti.
Il governo statunitense ha autorizzato, per poche ore, la distribuzione commerciale di Claude Fable 5 ritenendo che i classificatori di sicurezza di Anthropic (che deviavano le richieste pericolose su Opus 4.8) fossero sufficienti a neutralizzare la minaccia. Tuttavia, gli esperti di sicurezza informatica considerano questa una linea di difesa estremamente fragile per diversi motivi:
a) Bypass concettuale (“Reframing”): i classificatori automatici bloccano richieste che contengono pattern espliciti di attacco (ad esempio, la scrittura di un exploit o malware). Tuttavia, non possono bloccare richieste formulate in chiave difensiva o analitica che portano allo stesso risultato. Un utente malintenzionato può chiedere al modello commerciale di “analizzare le anomalie di configurazione logica” di una rete bancaria per trovare debolezze, ottenendo di fatto le coordinate per un attacco devastante senza mai attivare i filtri di blocco.
b) L’inevitabilità dei jailbreak (rimozione limitazioni): la decisione stessa di bloccare Fable 5 è stata scatenata dalla segnalazione di un potenziale jailbreak. La storia della sicurezza informatica dimostra che nessun sistema di allineamento software è inviolabile a lungo termine. Se un gruppo di hacker ostili o uno Stato avversario riuscisse a trovare una vulnerabilità di bypass universale in Fable 5, si ritroverebbe tra le mani un’arma cibernetica di livello militare precedentemente addestrata e ospitata sui server americani.
Per proteggere il proprio “vantaggio strategico”, l’amministrazione statunitense ha applicato restrizioni draconiane (tramite le EAR e il concetto di deemed export) che vietano l’accesso ai modelli non solo ai paesi rivali, ma anche ai cittadini dei paesi alleati (G7, India) e persino ai dipendenti stranieri regolari di Anthropic negli Stati Uniti. Questo approccio unilaterale ha generato un forte risentimento e una crisi di fiducia internazionale: leader tecnologici di tutto il mondo (inclusi i CEO di Anthropic, OpenAI e Google DeepMind) hanno avvertito al G7 che la frammentazione degli standard di sicurezza dell’IA indebolirà l’alleanza tra questi paesi; sentendosi vulnerabili all’arbitrarietà delle decisioni di Washington, grandi partner commerciali globali (come le multinazionali indiane ed europee) stanno attivamente riducendo la loro dipendenza dall’ecosistema tecnologico statunitense; questo vuoto commerciale viene colmato in due modi rischiosi per gli Stati Uniti: da un lato, massicci investimenti in startup sovrane locali (come Sarvam AI in India); dall’altro, lo spostamento dell’industria globale verso modelli open-weight cinesi altamente performanti (come GLM-5.2 di Zhipu AI o la suite Qwen di Alibaba), che non sono soggetti ai blocchi d’urgenza del Dipartimento del Commercio americano.

Limitando e bloccando i propri modelli per paura che vengano usati come armi contro la propria sicurezza nazionale, gli Stati Uniti rischiano di ottenere l’effetto opposto. Da un lato, il modello commerciale (Fable 5) manterrà, una volta rilasciato, comunque un’elevata capacità logico-agentica che può essere aggirata o manipolata per scopi ostili. Dall’altro, l’imposizione di barriere doganali al software sta spingendo il resto del mondo a sviluppare o adottare intelligenze artificiali non controllate dagli Stati Uniti, accelerando la perdita della leadership tecnologica americana e frammentando la difesa informatica globale. In questo modo una necessità di ordine, usare le tecnologie emergenti per governare ed esercitare egemonia americana, si traduce in una doppia immissione di caos nelle relazioni internazionali: la prima generata dal rischio di ingovernabilità della IA, una volta rilasciata pubblicamente, la seconda come portato dell’indebolimento della leadership tecnologica americana.

Così la vicenda Claude Fable 5 contro il governo degli Stati Uniti ci mostra che oggi la politica esiste come continuazione della guerra ibrida attraverso tre fatti materiali incontestabili:

La sottomissione della decisione alla tecnica. Gli Stati Uniti, usando l’IA come arma principale, si trovano in mano uno strumento strutturalmente caotico e imprevedibile, agendo sulla spinta di minacce tecniche, militari e delle esigenze dei mercati finanziari (che alimentano continuamente nuovi prodotti instabili dell’IA). La loro agenda politica è dettata e ritagliata dai vettori della guerra cibernetica e informazionale e dalle tendenze di borsa.
Il fallimento dei mezzi tradizionali. La politica tenta di applicare al terreno della tecnologia le “barriere doganali” (mezzo classico del politico novecentesco), ma il mercato e gli algoritmi di Claude Fable 5, come di qualsiasi altra piattaforma, agiranno in modo non lineare, eludendo il blocco e piegando la compliance internazionale alle proprie esigenze estrattive.
L’emergenza che decide, sovrana. Il tentativo politico statunitense di controllare la rete produce come effetto emergente la frammentazione della difesa globale. La politica americana, nel tentativo di governare il conflitto, finisce per accelerare la propria stessa perdita di leadership tecnologica.

Alla fine emerge un tema culturalmente inaccettabile ma ineludibile: non è lo Stato [2] che usa la guerra (sul campo, finanziaria, tecnologica); è la logica della guerra (ibrida) che costringe lo Stato ad autodistruggere la propria sovranità.

Fonte

Nota di redazione

[1] noi diremmo la politica occidentale.

[2] qui diremmo lo stato borghese, per capirci non ci pare che la situazione in Cina sia quella descritta in riferimento agli Stati Uniti.

Presentazione

30/06/2026

Claude Fable 5 e le sue potenzialità come ordigno

Nessun commento:

Posta un commento