Anthropic chiede un freno globale all’IA

repubblica.it, 5 giugno 2026

Anthropic chiede un freno globale all’IA

Anthropic, una delle principali aziende di intelligenza artificiale al mondo, ha preso una posizione che suona insolita per chi corre in prima fila sulla frontiera tecnologica: il mondo dovrebbe prendere in considerazione la possibilità di rallentare o sospendere temporaneamente lo sviluppo dei modelli di IA più avanzati.
La proposta arriva in chiusura di un documento dell’Anthropic Institute – il centro di ricerca dell’azienda che si occupa degli effetti dei sistemi di IA avanzati sulla società – dedicato all’intelligenza artificiale che “costruisce sé stessa” e in particolare a un fenomeno chiamato recursive self-improvement, l’auto-miglioramento ricorsivo: la capacità di un sistema IA di progettare e sviluppare, in piena autonomia, il proprio successore.
“Riteniamo che sarebbe positivo per il mondo avere la possibilità di rallentare o mettere temporaneamente in pausa lo sviluppo dell’IA di frontiera, per consentire alle strutture sociali e alla ricerca sull’allineamento di tenere il passo con l’avanzare della tecnologia”, scrive Anthropic.
Non è la prima volta che viene avanzata una richiesta di questo tipo. Nel 2023 una lettera aperta del Future of Life Institute, firmata da Elon Musk e altri imprenditori e ricercatori, invitava i laboratori di IA a sospendere per sei mesi l’addestramento dei modelli più potenti, sostenendo la necessità di sviluppare regole, standard di sicurezza e meccanismi di controllo adeguati prima di procedere verso sistemi sempre più avanzati.
Tre anni dopo, secondo Anthropic, il rischio di un’intelligenza artificiale fuori controllo è ancora più concreto.
La proposta: una pausa, ma solo se globale
Anthropic non propone una pausa unilaterale. Anzi, avverte che se solo gli attori più prudenti rallentassero, mentre laboratori meno cauti o governi rivali continuassero a correre, il risultato potrebbe essere meno sicurezza, non più sicurezza.
Per questo la pausa immaginata dal paper dovrebbe essere verificabile, coordinata tra più Paesi e più laboratori di frontiera, con regole chiare su quando scatta, quando finisce e chi controlla che nessuno stia barando.
Secondo Anthropic, la finestra per costruire questo sistema potrebbe essere molto più stretta di quanto governi e opinione pubblica pensino.
“Il mondo ha già costruito sistemi di verifica per altre tecnologie complesse, come il Trattato sulle forze nucleari a raggio intermedio [firmato nel 1987 da Stati Uniti e Unione Sovietica, nda] – scrive Anthropic -. Tuttavia, quei meccanismi hanno richiesto decenni per sviluppare sia le infrastrutture sia il livello di fiducia necessario tra le parti. Nel caso dell’IA, quel tempo potrebbe non esserci. Una pausa unilaterale da parte di un singolo laboratorio, invece, sarebbe attuabile immediatamente, ma produrrebbe effetti molto più limitati: cambierebbe chi guida la corsa, senza creare quel più ampio processo di confronto e deliberazione che oggi manca”.
Cos’è l’auto-miglioramento ricorsivo
Il recursive self-improvement, o auto-miglioramento ricorsivo, è uno scenario in cui un sistema di intelligenza artificiale non si limita ad aiutare gli sviluppatori, ma diventa capace di progettare e migliorare il proprio successore.
Oggi gli esseri umani costruiscono modelli che aiutano a costruire modelli migliori; domani, quel passaggio umano potrebbe restringersi fino a diventare unicamente supervisione e validazione di un lavoro svolto interamente dall’IA.
“Portata abbastanza avanti, e con abbastanza potenza di calcolo, questa tendenza punta verso un sistema in grado di costruire da solo la generazione successiva di sé stesso”, sostiene l’azienda.
Anthropic, fondata a San Francisco nel 2021 e diventata in breve tempo una società che vale quasi mille miliardi di dollari, è cauta nel definire i tempi: non siamo ancora al punto in cui i modelli si costruiscono da soli, sostiene l’azienda guidata da Dario Amodei, e l’auto-miglioramento ricorsivo “non è inevitabile”. Ma, avverte, “potrebbe arrivare prima di quanto la maggior parte delle istituzioni sia preparata ad affrontare”.
Le prove: l’IA che accelera l’IA
A sostegno della tesi, il documento dell’Anthropic Institute porta dati pubblici e altri finora inediti raccolti all’interno dell’azienda. Tra questi, la complessità dei compiti che i modelli riescono a portare a termine da soli: la durata delle attività gestibili in autonomia sta raddoppiando circa ogni quattro mesi, contro un ritmo precedente di un raddoppio ogni sette.
A marzo 2024 Claude Opus 3, uno dei modelli sviluppati da Anthropic, sapeva completare compiti software che a un umano richiedono circa quattro minuti; un anno dopo Claude Sonnet 3.7 arrivava a compiti da un’ora e mezza; quello successivo Claude Opus 4.6 gestiva attività da dodici ore. Se la tendenza regge, sostiene Anthropic, nel 2026 entreranno nel raggio d’azione compiti che richiederebbero giorni di lavoro umano, e nel 2027 addirittura settimane.
Attualmente più dell’80% del codice integrato nel codebase di Anthropic viene scritto da Claude, la stessa IA che viene offerta anche a imprese e privati.
Prima del lancio di Claude Code, lo strumento di coding di Anthropic, la quota era a livello di poche unità percentuali.
Lo stesso cambiamento emerge dalla produttività per ingegnere. Dal 2021 al 2024 il numero di righe di codice integrate ogni giorno da ciascun ingegnere era rimasto sostanzialmente stabile. Nel 2025 ha iniziato a crescere, quando Claude è passato dal suggerire codice all’eseguirlo direttamente; poi è aumentato ancora nel 2026, con modelli capaci di lavorare in autonomia su compiti più lunghi. Oggi, secondo Anthropic, un ingegnere medio dell’azienda integra otto volte più righe di codice rispetto al 2024.
Il codice “funziona”. E migliora. Anthropic insiste che non si tratta solo di quantità.
La frequenza con cui gli ingegneri dell’azienda, tra i migliori del mondo nel loro campo, devono correggere Claude o subentrare a metà di un compito è in calo costante da un anno, anche sui problemi più aperti e privi di una specifica chiara.
Sui compiti più indefiniti il tasso di successo del modello ha toccato il 76% lo scorso maggio, in crescita di 50 punti percentuali in sei mesi.
Il confronto con gli esseri umani, secondo Anthropic, è già a un punto di svolta. Il codice scritto da Claude era leggermente inferiore a quello prodotto dagli esseri umani a fine 2025. Oggi invece è sostanzialmente alla pari e l’azienda ritiene che diventerà “nettamente migliore” entro la fine del 2026.
Anche la revisione del codice, in Anthropic, è stata affidata recentemente all’IA. Ogni modifica viene ora letta da un revisore automatico basato su Claude, che cerca bug e falle di sicurezza prima dell’integrazione.
Un’analisi retrospettiva, racconta l’azienda, mostra che questo controllo automatico avrebbe intercettato circa un terzo dei bug all’origine di incidenti passati su claude.ai, la piattaforma dell’azienda attraverso cui fruire dei modelli più avanzati, prima ancora che arrivassero in produzione. In altre parole, l’IA sta trovando gli errori sfuggiti ad alcuni dei migliori ingegneri al mondo.
Il ruolo umano che si restringe
La conseguenza, scrive Anthropic, è che “il ruolo umano si sta restringendo a ogni passaggio” del processo di sviluppo.
Quando la qualità del codice umano e di quello generato dall’IA finiranno per equivalersi, il lavoro degli ingegneri si sposterà sempre più dalla scrittura alla revisione. E se la revisione umana non riuscirà a tenere il passo con la velocità con cui Claude produce codice, sarà proprio quella a diventare il nuovo collo di bottiglia.
Per ora, dunque, il vantaggio delle persone resta nella capacità di giudizio e nell’orientamento della ricerca: decidere quali problemi meritano attenzione, quali risultati sono affidabili e quando una strada va abbandonata.
Un futuro difficile da prevedere
Se queste tendenze proseguono, Anthropic immagina uno scenario in cui il ritmo del progresso è determinato quasi soltanto dalla disponibilità di calcolo, con gli umani spostati verso la supervisione e la verifica di un “laboratorio virtuale” gestito dalle macchine.
In altre parole il progresso potrebbe diventare molto più simile a una dinamica industriale automatizzata che a un processo scientifico tradizionale.
Il paper riconosce che sistemi del genere potrebbero anche avere effetti positivi, accelerando per esempio la medicina e la sicurezza informatica. Ma il rischio è simmetrico: se l’IA diventa abbastanza brava da migliorarsi, può anche amplificare i propri difetti.
Nessuno, scrive Anthropic, può prevedere oggi cosa potrebbe succedere: i modelli potrebbero rivelarsi abbastanza saggi da scoprire soluzioni che noi non abbiamo ancora trovato, o persino da fermarsi quando necessario.
Oppure i rari disallineamenti dei modelli odierni potrebbero moltiplicarsi man mano che le IA costruiscono i propri successori, diventando più frequenti e meno comprensibili “finché ne perdiamo il controllo”.
Il pericolo non è necessariamente un singolo momento da film di fantascienza in cui “la macchina prende il controllo”. È più sottile: una catena di sistemi sempre più capaci e sempre meno comprensibili, fino al punto in cui gli esseri umani non riescono più a seguire il loro sviluppo.
Un’analisi da maneggiare con cura
C’è però un limite che attraversa tutto il documento: la ricerca è condotta da Anthropic, sui modelli di Anthropic, con dati in larga parte interni e “finora inediti”, cioè non verificabili in modo indipendente. Tutto ruota attorno a Claude e al codebase dell’azienda, senza un confronto con sistemi concorrenti né una validazione esterna. È una base fragile per trarre conclusioni generali sul ritmo dello sviluppo dell’IA, ed è inevitabile che alimenti il sospetto di un’operazione almeno in parte promozionale.
Vale per questo il solito paradosso del settore: presentare la propria IA come potenzialmente minacciosa equivale a presentarla come straordinariamente potente. Un modello capace di scrivere l’80% del codice, di superare i suoi stessi creatori e di avvicinarsi all’auto-miglioramento è, prima ancora che un rischio per l’umanità, un prodotto formidabile da vendere a investitori e clienti.
La richiesta di una “pausa” e l’allarme sull’allineamento, in questa lettura, non sono in contraddizione con gli interessi commerciali dell’azienda: ne rafforzano la narrazione di leadership tecnologica e di guida responsabile del settore. Resta legittimo prendere sul serio i dati e gli avvertimenti, ma va ricordato che a pubblicarli è un’azienda che ha tutto l’interesse a far credere che la propria IA sia la più avanzata e, dunque, la più pericolosa.

PIER LUIGI PISA