xAI Anthropic: il patto decisivo da 300 MW

xAI Anthropic sposta 300 MW e 220.000 GPU su Claude: cosa significa per compute, energia, cloud, costi e imprese italiane nel 2026, con rischi concreti.

C. Petrolillo Redazione
13 min di lettura
10 Maggio 2026
Data center Colossus 1 del deal xAI Anthropic con GPU NVIDIA e infrastruttura AI ad alta capacità
[post_featured_image_caption_art]

Anthropic ha acquistato da SpaceXAI tutta la capacità di calcolo del data center Colossus 1 in Tennessee: oltre 300 megawatt e più di 220.000 GPU NVIDIA che, entro un mese, dovrebbero aumentare i limiti d'uso di Claude Pro, Claude Max, Claude Code e delle API Opus. Il deal xAI Anthropic, annunciato il 6 maggio 2026 e rilanciato da TechCrunch il 10 maggio, non è soltanto un contratto di fornitura: è il momento in cui un laboratorio AI nato per competere sui modelli diventa, almeno in parte, un venditore di infrastruttura.

La tensione non è difficile da individuare. Anthropic ha bisogno di calcolo perché la domanda di Claude cresce più velocemente della capacità disponibile; SpaceXAI ha bisogno di dimostrare che Colossus produce ricavi credibili anche se Grok non è diventato il modello enterprise di riferimento. In mezzo c'è il vero collo di bottiglia dell'AI contemporanea: non il prompt, non l'interfaccia, ma l'accesso continuo a energia, chip, raffreddamento, rete e capitale.

Come funziona il deal xAI Anthropic su Colossus 1

Per capire il deal xAI Anthropic bisogna distinguere due livelli spesso confusi nel dibattito pubblico. Il primo è il modello: Claude, Grok, GPT, Gemini, cioè il software che risponde agli utenti. Il secondo è il compute, l'insieme di chip, memoria, rete, storage ed energia che consente a quei modelli di essere addestrati o eseguiti in produzione. Colossus 1 appartiene al secondo livello: non è un chatbot, è una fabbrica di calcolo.

Nel comunicato ufficiale, Anthropic spiega che userà tutta la capacità del data center Colossus 1 per aumentare i limiti di Claude. Il dato operativo è esplicito: più di 300 MW di nuova capacità e oltre 220.000 GPU disponibili entro il mese. xAI, nel proprio annuncio, specifica che il cluster include H100, H200 e acceleratori GB200, cioè hardware pensato per carichi di trainingfine-tuninginference e sistemi multimodali su larga scala. Per chi lavora con modelli generativi, la distinzione è essenziale: il training costruisce o aggiorna il modello; l'inference lo fa rispondere agli utenti, spesso milioni di volte al giorno.

“Abbiamo firmato un accordo con SpaceX per usare tutta la capacità di calcolo del data center Colossus 1.” — Anthropic, comunicato ufficiale del 6 maggio 2026

Il punto tecnico è che Claude non ottiene solo più chip. Ottiene capacità distribuita dentro uno stack già costruito per carichi AI ad alta densità, con rete ad ampia banda, storage superiore al singolo exabyte dichiarato da xAI per Colossus e architetture pensate per spostare enormi quantità di dati tra GPU. È qui che termini come NVLink, memoria HBM e cluster fabric smettono di essere dettagli da scheda tecnica: nei modelli frontier, il problema non è solo fare calcoli, ma farli comunicare abbastanza in fretta da non lasciare migliaia di chip in attesa.

L'aspetto meno evidente è che Anthropic sta comprando tempo. L'azienda ha già accordi di scala con Amazon, Google, , Microsoft, e Fluidstack, ma molta di quella capacità arriverà progressivamente tra il 2026 e il 2027. Colossus 1 è diverso: è capacità quasi immediata. Per gli utenti finali questo si traduce in rate limit più alti; per gli sviluppatori significa meno strozzature sulle API; per le aziende che stanno integrando agenti e workflow basati su Claude, significa maggiore prevedibilità. Una definizione utile di questi termini si trova nel nostro Glossario AI, ma qui la parola chiave è industriale: disponibilità.

Questo spiega perché il contratto è più importante della semplice lista di chip. Claude Code, per esempio, non vive come un prodotto isolato: entra negli editor degli sviluppatori, nei repository, nei processi di review e nei flussi di automazione. Quando Anthropic raddoppia i limiti ogni cinque ore per i piani Pro, Max, Team ed Enterprise, sta cercando di rendere Claude meno intermittente come strumento di lavoro. La capacità di Colossus serve quindi soprattutto a trasformare un servizio potente ma soggetto a strozzature in infrastruttura utilizzabile durante la giornata lavorativa, senza continue attese o riduzioni nei momenti di picco.

I limiti del deal xAI Anthropic: energia, permessi e reputazione

Il limite principale del deal xAI Anthropic non riguarda la qualità di Claude. Riguarda il costo fisico dell'infrastruttura che lo sostiene. Un data center da oltre 300 MW non è una metafora: è un carico elettrico comparabile a quello di una città media, con vincoli su connessione alla rete, generazione locale, raffreddamento, autorizzazioni, emissioni e consenso della comunità che lo ospita.

Colossus è già un caso documentato. Nel 2025 il Southern Environmental Law Center, per conto della NAACP, ha contestato a xAI l'uso di turbine a gas non autorizzate nel sito di South Memphis. Nel maggio 2026, la NAACP ha chiesto un'ingiunzione preliminare per fermare un impianto collegato a Colossus 2, sostenendo che xAI e la controllata MZX Tech avessero portato il numero di turbine da 27 a 33. Secondo SELC, quelle turbine potrebbero emettere ogni anno 2.507 tonnellate di ossidi di azoto, 236 tonnellate di particolato fine, 837 tonnellate di monossido di carbonio e 25 tonnellate di formaldeide.

“La legge non va trattata come un suggerimento mentre le comunità locali ne sopportano le conseguenze.” — Laura Thoms, Earthjustice, comunicato SELC/NAACP

Questo non significa che Anthropic stia violando norme ambientali. Significa che sta acquistando capacità da un'infrastruttura che porta con sé un rischio reputazionale e regolatorio. La distinzione è importante: nelle filiere AI, la responsabilità non si ferma più al modello. Per un'azienda europea che usa Claude in un servizio critico, la domanda non è solo dove finiscono i dati o quanto costa il token, ma quale esposizione indiretta produce la dipendenza da data center iperconcentrati.

Il quadro energetico conferma che non si tratta di un caso isolato. L'International Energy Agency stima che i data center consumassero circa 415 TWh nel 2024, pari all'1,5% della domanda elettrica globale, e prevede un raddoppio a circa 945 TWh entro il 2030. Nel frattempo, la North American Electric Reliability Corporation ha segnalato nel 2026 rischi di stabilità della rete legati ai carichi computazionali, perché riduzioni improvvise da oltre 1.000 MW possono avvenire in pochi secondi.

La prospettiva degli operatori di rete rende il quadro ancora meno astratto. Un cluster AI non consuma energia come un edificio tradizionale: può variare carico in modo brusco quando sposta job, entra in protezione o passa a sistemi di backup. Per questo la crescita dei data center non è solo un tema di quantità di elettricità, ma di qualità dell'integrazione con la rete. Le utility devono sapere prima dove arriveranno i carichi, con quale profilo di domanda e con quali sistemi di disconnessione. Senza questo coordinamento, la promessa di “AI sempre disponibile” viene scaricata su infrastrutture elettriche progettate per tempi industriali molto più lenti.

La domanda che nessun comunicato ufficiale si pone è semplice: se un modello “sicuro” dipende da infrastrutture contestate per energia, emissioni e resilienza della rete, dove finisce davvero il perimetro della responsabilità AI?

Perché xAI Anthropic trasforma SpaceXAI in una neocloud

Chi segue il settore da vicino sa che le svolte più importanti raramente arrivano come dichiarazioni filosofiche: arrivano quando cambia il modo in cui una società fattura. Il deal xAI Anthropic indica che SpaceXAI può diventare una neocloud, cioè un operatore che acquista o costruisce capacità GPU e la affitta ad altri, invece di usarla solo per i propri modelli.

È un cambio di identità non banale. xAI era nata nel 2023 come laboratorio di frontiera, con Grok come prodotto consumer e ambizione dichiarata di competere con OpenAI, Anthropic e Google DeepMind. Dopo l'acquisizione da parte di SpaceX, il sito ufficiale xAI presenta il nuovo annuncio sotto il nome SpaceXAI. TechCrunch ha letto l'accordo in modo più scettico: se Colossus viene affittato ad Anthropic, forse SpaceXAI sta monetizzando capacità che non riesce a usare pienamente per Grok. È un'ipotesi, non una prova; ma è strategicamente plausibile.

Per Anthropic, invece, la logica è diversa. L'azienda non sta scegliendo un solo cloud: sta costruendo una rete di fornitori. Nel 2026 ha annunciato fino a 5 GW con Amazon, capacità con Google e dal 2027, 30 miliardi di dollari di capacità Azure tramite Microsoft e NVIDIA, oltre a 50 miliardi di dollari di investimento infrastrutturale negli Stati Uniti con Fluidstack. SpaceXAI si aggiunge come capacità immediata su GPU NVIDIA.

Il risultato è un mercato in cui il vantaggio competitivo non coincide più solo con il modello migliore. Conta la capacità di orchestrare hardware eterogeneo, spostare workload tra regioni, controllare costi di inference e mantenere SLA credibili per clienti enterprise. È qui che concetti come model routing e multi-provider diventano pratici: mandare ogni richiesta al modello e all'infrastruttura più adatti, invece di trattare l'AI come un'unica scatola magica. Per le aziende, il collegamento con le applicazioni AI è diretto: customer service, coding assistant, ricerca documentale e automazione interna hanno profili di latenza e costo molto diversi.

Questa dinamica sposta anche la narrazione sugli investimenti. Un laboratorio AI puro può promettere margini software; una neocloud promette ricavi più tangibili, ma anche costi enormi, ammortamenti hardware, rischi energetici e pressione sui prezzi. È più credibile nel breve periodo, meno seducente nel lungo se il mercato la valuta come infrastruttura commodity. Per SpaceXAI, il contratto con Anthropic dimostra domanda; per gli investitori, apre una domanda più dura: il valore sta nel modello Grok o nella capacità di vendere megawatt computazionali a chi ha modelli migliori?

Da GPT-3 a Colossus: come il compute è diventato il vero prodotto

La storia che porta a Colossus non inizia a Memphis. Inizia quando la ricerca AI ha cominciato a trattare il calcolo come variabile misurabile del progresso. Nel 2018 OpenAI pubblicò “AI and Compute”, mostrando che dal 2012 il compute usato nei più grandi training run cresceva con un tempo di raddoppio di 3,4 mesi, molto più rapido della legge di Moore. Due anni dopo, il paper “Scaling Laws for Neural Language Models”, firmato anche da Dario Amodei prima della nascita di Anthropic, formalizzò l'idea che performance, dimensione del modello, dati e calcolo seguono relazioni regolari.

Da lì l'industria ha imparato una lezione brutale: più compute non garantisce automaticamente un prodotto migliore, ma senza compute sufficiente non si resta al frontier. GPT-3 nel 2020 ha reso visibile la scala. GPT-4, Claude, Gemini e i modelli successivi hanno trasformato quella scala in un mercato. Le architetture si sono evolute, l'efficienza è migliorata, ma la domanda è cresciuta ancora più velocemente. L'arrivo degli agenti, del coding assistito e dei modelli di ragionamento ha spostato parte del costo dall'addestramento all'inference continua.

Colossus rappresenta la fase successiva: il compute non è più solo input industriale, diventa prodotto vendibile. Come le reti ferroviarie nell'Ottocento o le centrali elettriche nel Novecento, l'infrastruttura nasce per servire un progetto specifico e poi diventa piattaforma per altri operatori. La differenza è la velocità. xAI sostiene di aver costruito Colossus in 122 giorni e di averlo raddoppiato in 92 giorni fino a 200.000 GPU; anche se si accetta il dato come comunicazione aziendale, il messaggio industriale è chiaro: la competizione si gioca sui tempi di messa in servizio, non solo sulle architetture dei modelli.

Il richiamo ai data center orbitali, citato sia da Anthropic sia da xAI come interesse esplorativo, va letto dentro questo percorso. Non è una soluzione pronta. È una tesi strategica: se terra, energia e raffreddamento diventano colli di bottiglia, SpaceX può presentare la propria capacità di lancio come parte della filiera AI. È una visione ambiziosa, ma ancora piena di incognite tecniche, economiche e ambientali. Il fatto rilevante, oggi, è più concreto: un laboratorio AI compra capacità da un concorrente perché il mercato del calcolo è diventato più urgente del confine tra rivali.

Cosa cambia per l'Italia dopo il deal xAI Anthropic

Per l'Italia, il deal xAI Anthropic non significa che le imprese dovranno costruire data center da centinaia di megawatt. Significa qualcosa di più vicino e meno spettacolare: i servizi AI usati da aziende, studi professionali e pubbliche amministrazioni dipenderanno sempre più da una filiera globale di compute, cloud, chip e regolazione che va capita prima di firmare contratti pluriennali.

Il contesto italiano è già in movimento. Secondo l'Istat, nel 2025 il 16,4% delle imprese con almeno 10 addetti usa almeno una tecnologia di AI, il doppio rispetto all'8,2% del 2024. Tra le grandi imprese la quota sale al 53,1%, mentre tra le PMI arriva al 15,7%. Il Politecnico di Milano stima che il mercato AI italiano abbia raggiunto 1,8 miliardi di euro nel 2025, in crescita del 50%, con il 46% legato a soluzioni di Generative AI o progetti ibridi.

“La mancanza di competenze adeguate frena l'adozione dell'IA in quasi il 60% delle aziende.” — Istat, Imprese e ICT 2025

Questo è il punto operativo per manager, consulenti e sviluppatori italiani: la scarsità non è solo tecnologica, è organizzativa. Se un'azienda compra Claude, ChatGPT, Gemini o Grok come licenza pronta all'uso, eredita scelte infrastrutturali che non controlla. Deve quindi chiedere garanzie su data residency, continuità del servizio, audit, logging, gestione degli incidenti e portabilità dei workflow. Nel caso di settori regolati — finanza, sanità, manifattura critica, PA — queste domande non sono dettagli legali: sono prerequisiti di governance. Una mappa dei comparti più esposti si trova nella nostra sezione sui settori AI.

La Strategia italiana per l'Intelligenza Artificiale 2024-2026 insiste su soluzioni antropocentriche, affidabili e sostenibili. L'AI Act europeo, dal canto suo, introduce obblighi specifici per i modelli general-purpose, tra cui documentazione tecnica, politiche sul copyright e, per i modelli con rischio sistemico, valutazione e mitigazione dei rischi. Anche quando il fornitore è americano, l'uso sul mercato europeo non vive in un vuoto normativo.

Per i professionisti italiani cambia anche il modo di valutare i costi. Il prezzo al token è solo una parte della storia. Conta la prevedibilità dei limiti d'uso, la latenza nei picchi, la dipendenza da un singolo vendor, la possibilità di usare modelli alternativi, la capacità interna di misurare qualità e ritorno economico. Le imprese più mature non sceglieranno “il modello migliore” in astratto; costruiranno un portafoglio di strumenti, con regole chiare su quali task meritano modelli frontier e quali possono essere gestiti da soluzioni più leggere.

Per chi lavora in Italia su procurement, compliance o trasformazione digitale, la conseguenza pratica è un cambio di checklist. Non basta domandare se un modello supporta l'italiano, se ha una buona finestra di contesto o se integra Microsoft 365, Slack o ambienti di sviluppo. Bisogna chiedere come viene garantita la continuità operativa, quali regioni cloud sono disponibili, come vengono gestiti subfornitori e incidenti, quale piano esiste se un provider cambia condizioni commerciali o se una regione diventa indisponibile. Questa è una competenza nuova, a metà tra cloud architecture, gestione del rischio e diritto dei contratti digitali.

La lezione italiana del deal è quindi concreta: prima di adottare AI su processi critici, bisogna mappare la catena di fornitura del compute come si mapperebbe quella di un componente industriale. Chi vende un sistema AI dovrebbe dichiarare non solo accuratezza e funzionalità, ma anche dipendenze infrastrutturali, regioni di erogazione, piani di continuità e politiche energetiche. Chi compra dovrebbe pretendere queste informazioni nei contratti, non scoprirle quando un rate limit blocca un processo o una controversia ambientale finisce nelle pagine economiche.

Il dato che chiude il quadro è questo: nel 2025 l'AI è usata dal 16,4% delle imprese italiane con almeno 10 addetti, contro l'8,2% del 2024 e il 5,0% del 2023, secondo Istat.