MI vs. Erdős

Néhány matematikai probléma olyan egyszerűen van megfogalmazva, hogy egy gyereknek is elmagyarázható, mégis olyan nehezek, hogy matematikusok generációit foglalkoztatják. Az egyik ilyen probléma az úgynevezett egységtávolság-probléma: Helyezz el \(n\) pontot a síkban. Hány pontpár távolsága lehet ekkor pontosan \(1\) ? A probléma Erdős Pálig nyúlik vissza, és 1946 óta tanulmányozzák. Az OpenAI most publikálta, hogy egy belső modell megcáfolt egy régóta fennálló sejtést erről a problémáról.


Első pillantásra a kérdés ártalmatlannak tűnik. Ha \(n\) pontot helyezünk el egy egyenesen, akkor körülbelül \(n-1\) \(1\) hosszúságú intervallumot kapunk. Ha a pontokat rácsként rendezzük el, mint például milliméterpapíron, akkor lényegesen több ilyen intervallumot kapunk: vízszintesen és függőlegesen a szomszédos pontok között. Erdős már talált olyan konstrukciókat, amelyek valamivel jobbak voltak, mint a lineárisak. Sokáig azonban úgy hitték, hogy ez nem javítható jelentősen. Formálisan az volt a feltételezés, hogy az ilyen egységnyi intervallumok maximális száma csak körülbelül \(n^{1+o(1)}\) növekszik, azaz valamivel gyorsabban, mint \(n\) , de nem rögzített kiegészítő kitevővel.

Pontosan ez a meglepő pont: Az OpenAI modellje (amelyet nem hoztak nyilvánosságra) nem egyetlen ellenpéldát, hanem egy végtelen ponthalmaz-családot konstruált \(P\) , amelyeknél az egységnyi távolságok száma legalább \(|P|^{1+\delta}\) , rögzített \(\delta>0\) értékkel. Will Sawin későbbi finomítása az OpenAI szerint még \(\delta=0{,}014\) értéket is eredményez. Ez kicsinek hangzik, de matematikailag hatalmas: már nem logaritmikus maradékról van szó, hanem valódi polinomiális nyereségről.

Egy egyszerű példa illusztrálja az alapötletet. Tekintsük a komplex számot

\[
u=\frac{2+i}{2-i}=\frac{3+4i}{5}=\frac35+\frac45i.
\]

Ennek a számnak az abszolút értéke \(1\) , mivel

\[
\left|\frac35+\frac45i\right|=\sqrt{\left(\frac35\right)^2+\left(\frac45\right)^2}=1.
\]

Tehát, ha \(x\) pont a síkon, akkor \(x\) és \(x+u\) pontosan \(1\) távolságra vannak egymástól. Konkrétan például a pontok a következő helyen találhatók:

\[
0
\quad\text{und}\quad
\frac35+\frac45i
\]

pontosan egy egységnyi távolságra. Egy számelméleti kifejezés így egy \(1\) hosszúságú geometriai irányt eredményez. Ez még nem a nagy ellenbizonyítás, de a trükk kicsinyített változata: nemcsak a vízszintes és függőleges egységnyi távolságokat keressük, mint a rácsban, hanem sok aritmetikailag generált irányt is, amelyek mindegyikének hossza pontosan \(1\) .

A tényleges konstrukció lényegesen hatékonyabb eszközöket használ. Ahelyett, hogy csak a Gauss-egész számokkal dolgozna \(\mathbb{Z}[i]\) , a bizonyítás bonyolultabb algebrai számmezőket \(K=L(i)\) használ. Itt a forma számos eleme

\[
u=\frac{\alpha}{c(\alpha)}
\]

szerkesztve, ahol \(c\) a komplex konjugáció szerepét játssza. A döntő hatás a következő: a releváns komplex beágyazások közül ezek az \(u\) mindegyikének \(1\) nagysága van. Ezért számos különböző egységirányra alkalmasak.

Nagyon durván fogalmazva, egy igazi ellenpélda nem úgy néz ki, mint egy kicsi, szép kép tíz ponttal, hanem inkább mint egy hatalmas, aritmetikailag konstruált pontraj. Fogsz egy nagy dimenziójú rácsot, kivágsz belőle megfelelő pontokat, majd ezeket visszavetíted a közönséges síkra. A bizonyítási jelölésben ezt nagyjából a következő formában fejezzük ki...

\[
P_j=\pi_1\big((y+\Lambda_j)\cap W\big),
\]

Más szóval: Egy eltolt \(y+\Lambda_j\) rácsról veszünk pontokat, leszűkítjük őket egy \(W\) régióval, és \(\pi_1\) koordinátával vetítjük őket egy komplex koordinátára, azaz \(\mathbb{C}\cong\mathbb{R}^2\) koordinátára. Ezen pontok közötti számos különbség pontosan ilyen \(u\) elem, amelynek nagysága \(1\) . Ezért a vetítés után ezek a pontok valódi egységnyi távolsággá válnak a síkban.

Egy vizuális analógia a következő: A standard rács néhány egyszerű irányt használ, például jobbra, balra, fel és le. Az új konstrukció azonban rengeteg rejtett irányt generál, amelyek az algebrai számelméletből származnak. Minden irány pontosan egy egység hosszú. Mivel nagyon sok ilyen irány van, és sok pont felel meg nekik, az egységnyi távolságok teljes összege nagyobb, mint amit a régi sejtés megengedne.

Az is figyelemre méltó, honnan származik a bizonyítás. Az OpenAI szerint a megoldást egy általános gondolkodási modell autonóm módon találta meg, nem pedig egy erre a problémára kiképzett matematikai rendszer. A bizonyítást ezután belső és külső ellenőrzésnek vetették alá, és ember által olvasható formába öntötték. A külső matematikusok kísérő jegyzetei is hangsúlyozzák, hogy ez nem csupán egy ismert módszer automatizált változata, hanem egy váratlan kapcsolat a diszkrét geometria és az algebrai számelmélet között.

Valószínűleg ez az igazi oka annak, hogy ez az eredmény annyira érdekes. Nem csak arról van szó, hogy egy mesterséges intelligencia helyesen old meg egy problémát. Hanem arról, hogy talált egy olyan utat, ami sokak számára nem volt nyilvánvaló: a síkbeli távolságokkal kapcsolatos geometriai probléma megoldása a számelmélet mélyreható eszközeivel. Ez nem teszi a matematikát kevésbé emberivé. De egy új, meglehetősen kellemetlenül erős ellenfelet ad neki.

Vissza