Un modello interno di OpenAI ha smentito una congettura di Paul Erdős del 1946 sul problema della distanza unitaria, portando l'AI matematica dentro un territorio rimasto aperto per 80 anni.
Per chi usa o costruisce sistemi AI, il valore pratico sta nella verifica. Un modello generalista ha proposto un controesempio, matematici esterni lo hanno controllato e una nota tecnica lo ha trasformato in argomento leggibile. Questo sposta l'AI da strumento di calcolo a partner di ricerca, almeno nei domini dove le risposte possono essere controllate riga per riga.
Il problema dei punti a distanza 1
Il problema sembra da quaderno: disponete n punti su un piano e chiedete quante coppie possono trovarsi esattamente a distanza 1. Una linea dà quasi n coppie; una griglia quadrata fa meglio e per decenni ha orientato l'intuizione dei matematici.
Erdős sospettava che costruzioni di quel tipo fossero essenzialmente ottimali, con un limite vicino a n^(1+O(1/log log n)). In parole meno tecniche: molti pensavano che l'ordine nascosto nella griglia fosse il meglio possibile.
Secondo l'annuncio di OpenAI, il modello ha trovato una famiglia infinita di configurazioni che supera quel limite con un miglioramento polinomiale. Il paper parla di insiemi di n punti con almeno n^(1+δ) coppie a distanza unitaria per infiniti valori di n. OpenAI segnala anche un raffinamento di Will Sawin con δ = 0,014.
Nel manoscritto tecnico compare una frase breve, ma pesante:
“This problem was solved in a completely automated fashion.”
La cautela serve. Il testo finale non è l'output grezzo del modello: OpenAI dichiara che ricercatori interni e matematici esterni hanno esaminato la soluzione, riscritto l'esposizione e aggiunto riferimenti. Una nota su arXiv, firmata da nove matematici tra cui Noga Alon, Timothy Gowers, Daniel Litt e Melanie Matchett Wood, presenta una versione verificata e digerita dell'argomento.
Dove l'AI matematica ha trovato il varco
Il passaggio tecnico sorprendente non arriva da una griglia più furba. Arriva dalla teoria algebrica dei numeri, l'area che studia strutture numeriche più ricche degli interi ordinari. Il paper costruisce campi di numeri con molte scomposizioni favorevoli, trasforma elementi di norma 1 in vettori di lunghezza 1 e poi li riporta nel piano.
Per il lettore non specialista, il punto è questo: il modello ha collegato una domanda geometrica elementare a strumenti aritmetici sofisticati. Non ha solo macinato casi. Ha trovato una strada laterale che molti matematici non stavano battendo con quella intensità.
La domanda scomoda è inevitabile: se l'idea nasce dal modello e la prova viene stabilizzata da ricercatori umani, chi riceve il credito scientifico quando il prossimo risultato arriverà con lo stesso schema?
Perché cambia il panorama AI
Il risultato di OpenAI arriva mentre altri laboratori stanno spingendo sulla matematica verificabile. Un paper collegato a Google DeepMind, pubblicato il 21 maggio 2026, descrive agenti capaci di generare prove formali in Lean, un sistema che controlla ogni passaggio logico come un compilatore controlla codice.
In quel test, l'agente più forte ha risolto autonomamente 9 problemi aperti di Erdős su 353 e ha provato 44 congetture OEIS su 492, con un costo di poche centinaia di dollari per problema. La differenza è importante: OpenAI mostra una scoperta matematica verificata da esperti; DeepMind mostra un processo in cui la verifica formale riduce il rischio di allucinazioni.
Cosa cambia per il lettore italiano
Se un modello riesce a tenere insieme un ragionamento lungo, collegare letterature lontane e produrre un risultato controllabile, lo stesso schema può diventare rilevante in chimica, materiali, biologia computazionale, ottimizzazione industriale e sicurezza del software.
La competenza umana non perde valore: cambia posizione. Servono persone capaci di formulare problemi, valutare prove, riconoscere scorciatoie fragili e trasformare un output promettente in conoscenza utilizzabile. Per chi lavora con l'AI in Italia, la prossima soglia non sarà scrivere prompt migliori, ma costruire processi in cui ogni risposta importante abbia una verifica all'altezza del rischio.
