AI vs. Erdős

Vissa matematiska problem är formulerade så enkelt att de kan förklaras för ett barn, men ändå så svåra att de upptar generationer av matematiker. Ett sådant problem är det så kallade enhetsavståndsproblemet: Placera \(n\) punkter i planet. Hur många punktpar kan då ha ett avstånd på exakt \(1\) ? Problemet går tillbaka till Paul Erdős och har studerats sedan 1946. OpenAI har nu publicerat att en intern modell har motbevisat en långvarig antagande om detta problem.


Vid första anblicken låter frågan harmlös. Om man placerar \(n\) punkter på en rak linje får man ungefär \(n-1\) intervall av längden \(1\) . Om man arrangerar punkterna som ett rutnät, som på rutat papper, får man betydligt fler av dessa intervall: horisontellt och vertikalt mellan intilliggande punkter. Erdős hade redan funnit konstruktioner som var något bättre än linjära. Under lång tid trodde man dock att detta inte kunde förbättras nämnvärt. Formellt sett var antagandet att det maximala antalet sådana enhetsintervall bara växer ungefär \(n^{1+o(1)}\) , det vill säga något snabbare än \(n\) , men inte med en fast ytterligare exponent.

Det är just detta som är den överraskande poängen: OpenAI-modellen (som inte avslöjades) konstruerade inte bara ett enda motexempel, utan en oändlig familj av punktmängder \(P\) för vilka antalet enhetsavstånd är minst \(|P|^{1+\delta}\) , med ett fast \(\delta>0\) . En senare förfining av Will Sawin, enligt OpenAI, ger till och med \(\delta=0{,}014\) . Detta låter litet, men är matematiskt enormt: Det är inte längre en logaritmisk rest, utan en sann polynomförstärkning.

Ett enkelt exempel illustrerar grundidén. Låt oss betrakta det komplexa talet

\[
u=\frac{2+i}{2-i}=\frac{3+4i}{5}=\frac35+\frac45i.
\]

Detta tal har ett absolutvärde på \(1\) , eftersom

\[
\left|\frac35+\frac45i\right|=\sqrt{\left(\frac35\right)^2+\left(\frac45\right)^2}=1.
\]

Därför, om \(x\) är en punkt i planet, så är \(x\) och \(x+u\) exakt \(1\) från varandra. Specifikt, till exempel, är punkterna belägna vid...

\[
0
\quad\text{und}\quad
\frac35+\frac45i
\]

exakt en enhet ifrån varandra. Ett talteoretiskt uttryck ger således en geometrisk riktning med längden \(1\) . Detta är ännu inte det stora motbeviset, men det är den lilla versionen av tricket: man letar inte bara efter horisontella och vertikala enhetsavstånd som i rutnätet, utan efter många aritmetiskt genererade riktningar, som alla har exakt längden \(1\) .

Själva konstruktionen använder betydligt kraftfullare verktyg. Istället för att bara arbeta med Gaussiska heltal \(\mathbb{Z}[i]\) , använder beviset mer komplicerade algebraiska talfält \(K=L(i)\) . Där finns många element av formen

\[
u=\frac{\alpha}{c(\alpha)}
\]

konstruerad, där \(c\) spelar rollen av komplex konjugering. Den avgörande effekten är: bland de relevanta komplexa inbäddningarna har dessa \(u\) var och en en magnitud på \(1\) . De är därför kandidater för många olika enhetsriktningar.

Mycket grovt uttryckt ser ett sant motexempel inte ut som en liten, fin bild med tio punkter, utan snarare som en enorm, aritmetiskt konstruerad svärm av punkter. Man tar ett högdimensionellt rutnät, skär ut lämpliga punkter från det och projicerar sedan dessa tillbaka på det ordinära planet. I bevisnotation uttrycks detta grovt i formen...

\[
P_j=\pi_1\big((y+\Lambda_j)\cap W\big),
\]

Med andra ord: Man tar punkter från ett förskjutet rutnät \(y+\Lambda_j\) , begränsar dem med ett område \(W\) , och projicerar dem med \(\pi_1\) på en komplex koordinat, dvs. på \(\mathbb{C}\cong\mathbb{R}^2\) . Många skillnader mellan dessa punkter är då just sådana \(u\) element med magnitud \(1\) . Därför blir de, efter projektionen, verkliga enhetsavstånd i planet.

En visuell analogi är denna: Standardrutnätet använder några enkla riktningar, såsom höger, vänster, upp och ner. Den nya konstruktionen genererar dock ett stort antal dolda riktningar härledda från algebraisk talteori. Varje riktning är exakt en enhet lång. Eftersom det finns så många sådana riktningar och många punkter motsvarar dem, är de totala enhetsavstånden större än vad den gamla antagandet skulle tillåta.

Det är också anmärkningsvärt varifrån beviset kommer. Enligt OpenAI hittades lösningen autonomt genom en generell resonemangsmodell, inte av ett matematiskt system som specifikt tränats för detta problem. Beviset granskades sedan internt och externt och återgavs till en läsbar form. De medföljande anteckningarna från externa matematiker betonar också att detta inte bara är en automatiserad version av en känd metod, utan en oväntad koppling mellan diskret geometri och algebraisk talteori.

Det här är förmodligen den verkliga anledningen till att det här resultatet är så intressant. Det handlar inte bara om att en AI löser ett problem korrekt. Det handlar om att den hittar ett sätt som inte var uppenbart för många: att ta itu med ett geometriskt problem om avstånd i ett plan med djupgående verktyg från talteori. Detta gör inte matematiken mindre mänsklig. Men det ger den en ny, ganska obehagligt kraftfull motståndare.

Tillbaka