Bazı matematiksel problemler o kadar basit formüle edilmiştir ki bir çocuğa bile açıklanabilir, ancak o kadar zordur ki nesiller boyu matematikçileri meşgul eder. Bu tür problemlerden biri de birim uzaklık problemi olarak adlandırılan problemdir: Düzlemde \(n\) nokta yerleştirin. Bu noktalar arasındaki mesafe tam olarak \(1\) olan kaç çift nokta vardır? Problem, Paul Erdős'e kadar uzanır ve 1946'dan beri incelenmektedir. OpenAI, dahili bir modelin bu problemle ilgili uzun süredir geçerli olan bir varsayımı çürüttüğünü yayınladı.
İlk bakışta soru zararsız görünüyor. Eğer düz bir çizgi üzerinde \(n\) nokta yerleştirirseniz, yaklaşık olarak \(1\) uzunluğunda \(n-1\) aralık elde edersiniz. Noktaları, grafik kağıdındaki gibi bir ızgara şeklinde düzenlerseniz, bitişik noktalar arasında yatay ve dikey olarak önemli ölçüde daha fazla aralık elde edersiniz. Erdős, doğrusal yapılardan biraz daha iyi olan yapılar zaten bulmuştu. Ancak uzun süre bunun önemli ölçüde geliştirilemeyeceğine inanılıyordu. Biçimsel olarak, bu tür birim aralıkların maksimum sayısının yalnızca yaklaşık olarak \(n^{1+o(1)}\) kadar arttığı, yani \(n\) biraz daha hızlı, ancak sabit bir ek üs ile değil, varsayılıyordu.
Şaşırtıcı olan nokta tam olarak bu: OpenAI modeli (hangi model olduğu açıklanmadı) sadece tek bir karşı örnek değil, birim mesafelerin sayısının en az \(|P|^{1+\delta}\) olduğu, sabit bir \(\delta>0\) ile sonsuz bir nokta kümesi \(P\) ailesi oluşturdu. OpenAI'ye göre, Will Sawin tarafından yapılan daha sonraki bir iyileştirme, \(\delta=0{,}014\) değerini bile veriyor. Bu küçük gibi görünse de matematiksel olarak muazzam: Artık logaritmik bir kalan değil, gerçek bir polinom kazancı.
Basit bir örnek, temel fikri açıklıyor. Karmaşık sayıyı ele alalım.
\[
u=\frac{2+i}{2-i}=\frac{3+4i}{5}=\frac35+\frac45i.
\]
Bu sayının mutlak değeri \(1\) , çünkü
\[
\left|\frac35+\frac45i\right|=\sqrt{\left(\frac35\right)^2+\left(\frac45\right)^2}=1.
\]
Dolayısıyla, eğer \(x\) düzlemde bir nokta ise, \(x\) ve \(x+u\) noktaları tam olarak \(1\) uzaklıktadır. Özellikle, örneğin, noktalar şu konumlarda yer almaktadır...
\[
0
\quad\text{und}\quad
\frac35+\frac45i
\]
Tam olarak bir birim uzaklıkta. Böylece bir sayı kuramı ifadesi, uzunluğu \(1\) olan bir geometrik yön verir. Bu henüz büyük karşı ispat değil, ancak hilenin küçük versiyonudur: ızgaradaki gibi sadece yatay ve dikey birim mesafeleri aramakla kalmaz, aynı zamanda uzunluğu tam olarak \(1\) olan birçok aritmetik olarak üretilmiş yönü de ararız.
Asıl yapı, önemli ölçüde daha güçlü araçlar kullanır. Sadece Gauss tamsayıları \(\mathbb{Z}[i]\) ile çalışmak yerine, ispat daha karmaşık cebirsel sayı alanları \(K=L(i)\) kullanır. Orada, şu biçimde birçok eleman bulunur:
\[
u=\frac{\alpha}{c(\alpha)}
\]
Burada \(c\) karmaşık eşlenik rolünü oynar. En önemli etki şudur: ilgili karmaşık gömülmeler arasında, bu \(u\) ların her birinin büyüklüğü \(1\) 'dir. Bu nedenle, birçok farklı birim yönü için adaydırlar.
Kabaca söylemek gerekirse, gerçek bir karşı örnek, on noktadan oluşan küçük, güzel bir resme benzemez; daha ziyade aritmetik olarak oluşturulmuş devasa bir nokta kümesine benzer. Yüksek boyutlu bir ızgara alırsınız, ondan uygun noktaları kesersiniz ve sonra bunları sıradan düzleme geri yansıtırsınız. İspat gösteriminde bu, kabaca şu biçimde ifade edilir...
\[
P_j=\pi_1\big((y+\Lambda_j)\cap W\big),
\]
Başka bir deyişle: Kaydırılmış bir ızgaradan \(y+\Lambda_j\) noktalar alınır, bunlar bir \(W\) bölgesiyle sınırlandırılır ve \(\pi_1\) ile karmaşık bir koordinata, yani \(\mathbb{C}\cong\mathbb{R}^2\) üzerine yansıtılır. Bu noktalar arasındaki birçok fark, tam olarak büyüklüğü \(1\) olan bu tür \(u\) elemanlarıdır. Bu nedenle, yansıtmadan sonra, düzlemde gerçek birim mesafeler haline gelirler.
Görsel bir benzetme şu şekildedir: Standart ızgara, sağ, sol, yukarı ve aşağı gibi birkaç basit yön kullanır. Ancak yeni yapı, cebirsel sayı teorisinden türetilen çok sayıda gizli yön üretir. Her yön tam olarak bir birim uzunluğundadır. Bu kadar çok yön ve bunlara karşılık gelen çok sayıda nokta olduğundan, toplam birim mesafeleri eski varsayımın izin verdiğinden daha büyüktür.
Kanıtın nereden geldiği de dikkat çekicidir. OpenAI'ye göre, çözüm bu problem için özel olarak eğitilmiş bir matematiksel sistem tarafından değil, genel bir akıl yürütme modeli tarafından otomatik olarak bulunmuştur. Kanıt daha sonra dahili ve harici olarak incelenmiş ve insan tarafından okunabilir bir forma dönüştürülmüştür. Dışarıdan matematikçilerin eşlik eden notları da bunun sadece bilinen bir yöntemin otomatikleştirilmiş bir versiyonu olmadığını, ayrık geometri ile cebirsel sayı teorisi arasında beklenmedik bir bağlantı olduğunu vurgulamaktadır.
Bu muhtemelen bu sonucun bu kadar ilginç olmasının gerçek nedenidir. Bu sadece bir yapay zekanın bir problemi doğru bir şekilde çözmesiyle ilgili değil. Birçok insan için açık olmayan bir yolu bulmasıyla ilgili: düzlemdeki mesafelerle ilgili geometrik bir problemi sayı teorisinin derin araçlarıyla ele almak. Bu, matematiği daha az insani yapmaz. Ancak ona yeni, oldukça rahatsız edici derecede güçlü bir rakip kazandırır.