AI kontra Erdős

Niektóre problemy matematyczne są sformułowane tak prosto, że można je wytłumaczyć dziecku, a jednocześnie tak trudne, że zajmują pokolenia matematyków. Jednym z takich problemów jest tzw. problem odległości jednostkowej: należy umieścić \(n\) punktów na płaszczyźnie. Ile par punktów może mieć wówczas odległość dokładnie równą \(1\) ? Problem ten sięga czasów Paula Erdősa i jest badany od 1946 roku. Firma OpenAI opublikowała niedawno informację, że model wewnętrzny obalił długo utrzymywaną hipotezę na ten temat.


Na pierwszy rzut oka pytanie brzmi niewinnie. Jeśli umieścisz \(n\) punktów na linii prostej, otrzymasz w przybliżeniu \(n-1\) przedziałów o długości \(1\) . Jeśli ułożysz punkty w siatkę, jak na papierze milimetrowym, otrzymasz znacznie więcej takich przedziałów: poziomo i pionowo między sąsiednimi punktami. Erdős znalazł już konstrukcje nieco lepsze od liniowych. Przez długi czas uważano jednak, że nie da się ich znacząco ulepszyć. Formalnie zakładano, że maksymalna liczba takich przedziałów jednostkowych rośnie tylko w przybliżeniu \(n^{1+o(1)}\) , czyli nieco szybciej niż \(n\) , ale nie ze stałym dodatkowym wykładnikiem.

To właśnie jest zaskakujący punkt: model OpenAI (który, nie został ujawniony) skonstruował nie tylko pojedynczy kontrprzykład, ale nieskończoną rodzinę zbiorów punktów \(P\) dla których liczba odległości jednostkowych wynosi co najmniej \(|P|^{1+\delta}\) , ze stałym \(\delta>0\) . Późniejsze udoskonalenie Willa Sawina, według OpenAI, daje nawet \(\delta=0{,}014\) . Brzmi to mało, ale matematycznie jest ogromne: nie jest to już reszta logarytmiczna, ale prawdziwy zysk wielomianowy.

Prosty przykład ilustruje podstawową ideę. Rozważmy liczbę zespoloną

\[
u=\frac{2+i}{2-i}=\frac{3+4i}{5}=\frac35+\frac45i.
\]

Liczba ta ma wartość bezwzględną równą \(1\) , ponieważ

\[
\left|\frac35+\frac45i\right|=\sqrt{\left(\frac35\right)^2+\left(\frac45\right)^2}=1.
\]

Zatem, jeśli \(x\) jest punktem na płaszczyźnie, to \(x\) i \(x+u\) są oddalone od siebie o dokładnie \(1\) . Dokładniej, na przykład, punkty te znajdują się w...

\[
0
\quad\text{und}\quad
\frac35+\frac45i
\]

dokładnie o jedną jednostkę. Wyrażenie z teorii liczb daje zatem kierunek geometryczny o długości \(1\) . Nie jest to jeszcze wielki kontrargument, ale uproszczona wersja sztuczki: szuka się nie tylko odległości jednostkowych w poziomie i pionie, jak w siatce, ale wielu arytmetycznie generowanych kierunków, z których wszystkie mają dokładnie długość \(1\) .

Właściwa konstrukcja wykorzystuje znacznie bardziej zaawansowane narzędzia. Zamiast pracować tylko z liczbami całkowitymi Gaussa \(\mathbb{Z}[i]\) , dowód wykorzystuje bardziej skomplikowane algebraiczne pola liczbowe \(K=L(i)\) . W tym przypadku wiele elementów postaci

\[
u=\frac{\alpha}{c(\alpha)}
\]

skonstruowane, gdzie \(c\) pełni rolę sprzężenia zespolonego. Kluczowy efekt jest taki: spośród odpowiednich osadzeń zespolonych, każde z tych \(u\) ma moduł \(1\) . Są one zatem kandydatami do wielu różnych kierunków jednostkowych.

Mówiąc najogólniej, prawdziwy kontrprzykład nie wygląda jak mały, ładny obrazek z dziesięcioma kropkami, ale raczej jak ogromny, skonstruowany arytmetycznie rój kropek. Bierzesz wielowymiarową siatkę, wycinasz z niej odpowiednie punkty, a następnie rzutujesz je z powrotem na zwykłą płaszczyznę. W notacji dowodowej wyraża się to w przybliżeniu w postaci…

\[
P_j=\pi_1\big((y+\Lambda_j)\cap W\big),
\]

Innymi słowy: bierze się punkty z przesuniętej siatki \(y+\Lambda_j\) , ogranicza się je obszarem \(W\) i rzutuje się je z \(\pi_1\) na współrzędną zespoloną, tj. na \(\mathbb{C}\cong\mathbb{R}^2\) . Wiele różnic między tymi punktami to właśnie takie \(u\) elementy o module \(1\) . Zatem po rzucie stają się one rzeczywistymi odległościami jednostkowymi na płaszczyźnie.

Analogia wizualna jest taka: standardowa siatka wykorzystuje kilka prostych kierunków, takich jak prawo, lewo, góra i dół. Nowa konstrukcja generuje jednak ogromną liczbę ukrytych kierunków wyprowadzonych z algebraicznej teorii liczb. Każdy kierunek ma długość dokładnie jednej jednostki. Ponieważ istnieje tak wiele takich kierunków i wiele punktów im odpowiada, całkowite odległości jednostkowe są większe, niż pozwalałaby na to stara hipoteza.

Warto również zwrócić uwagę na źródło dowodu. Według OpenAI rozwiązanie zostało znalezione autonomicznie przez ogólny model wnioskowania, a nie przez system matematyczny specjalnie wyszkolony pod kątem tego problemu. Dowód został następnie zweryfikowany wewnętrznie i zewnętrznie oraz przekształcony w formę czytelną dla człowieka. W towarzyszących notatkach zewnętrznych matematyków podkreślono również, że nie jest to jedynie zautomatyzowana wersja znanej metody, ale nieoczekiwany związek między geometrią dyskretną a algebraiczną teorią liczb.

To prawdopodobnie prawdziwy powód, dla którego ten wynik jest tak interesujący. Nie chodzi tylko o to, że sztuczna inteligencja poprawnie rozwiązuje problem. Chodzi o to, że znajduje sposób, który dla wielu nie był oczywisty: rozwiązuje problem geometryczny dotyczący odległości na płaszczyźnie za pomocą zaawansowanych narzędzi z teorii liczb. To nie czyni matematyki mniej ludzką. Ale daje jej nowego, dość niepokojąco silnego przeciwnika.

Plecy