هوش مصنوعی در مقابل اردوش

برخی از مسائل ریاضی آنقدر ساده فرموله شده‌اند که می‌توان آنها را برای یک کودک توضیح داد، اما آنقدر دشوار هستند که نسل‌ها ریاضیدان را به خود مشغول می‌کنند. یکی از این مسائل، مسئله‌ی فاصله‌ی واحد است: \(n\) نقطه را در صفحه قرار دهید. در این صورت چند جفت نقطه می‌توانند فاصله‌ی دقیقاً \(1\) داشته باشند؟ این مسئله به پاول اردوش برمی‌گردد و از سال ۱۹۴۶ مورد مطالعه قرار گرفته است. OpenAI اکنون منتشر کرده است که یک مدل داخلی، حدس طولانی مدت در مورد این مسئله را رد کرده است.


در نگاه اول، این سوال بی‌ضرر به نظر می‌رسد. اگر \(n\) نقطه را روی یک خط مستقیم قرار دهید، تقریباً \(n-1\) بازه به طول \(1\) خواهید داشت. اگر نقاط را به صورت یک شبکه، مانند کاغذ شطرنجی، مرتب کنید، تعداد قابل توجهی از این بازه‌ها را خواهید داشت: به صورت افقی و عمودی بین نقاط مجاور. اردوش قبلاً ساختارهایی را یافته بود که تا حدودی بهتر از خطی بودند. با این حال، برای مدت طولانی اعتقاد بر این بود که این نمی‌تواند به طور قابل توجهی بهبود یابد. به طور رسمی، فرض بر این بود که حداکثر تعداد چنین بازه‌های واحدی فقط تقریباً \(n^{1+o(1)}\) رشد می‌کند، یعنی تا حدودی سریع‌تر از \(n\) ، اما نه با یک توان اضافی ثابت.

نکته‌ی شگفت‌انگیز دقیقاً همین است: مدل OpenAI (که البته فاش نشد) نه تنها یک مثال نقض واحد، بلکه یک خانواده‌ی نامتناهی از مجموعه نقاط \(P\) را ساخته است که تعداد فواصل واحد برای آنها حداقل \(|P|^{1+\delta}\) است، با یک \(\delta>0\) . طبق گفته‌ی OpenAI، اصلاح بعدی توسط ویل ساوین حتی \(\delta=0{,}014\) را نیز به دست می‌دهد. این عدد کوچک به نظر می‌رسد، اما از نظر ریاضی بسیار بزرگ است: این دیگر یک باقیمانده‌ی لگاریتمی نیست، بلکه یک بهره‌ی چندجمله‌ای واقعی است.

یک مثال ساده، ایده اصلی را روشن می‌کند. بیایید عدد مختلط را در نظر بگیریم.

\[
u=\frac{2+i}{2-i}=\frac{3+4i}{5}=\frac35+\frac45i.
\]

این عدد دارای قدر مطلق \(1\) است، زیرا

\[
\left|\frac35+\frac45i\right|=\sqrt{\left(\frac35\right)^2+\left(\frac45\right)^2}=1.
\]

بنابراین، اگر \(x\) نقطه‌ای در صفحه باشد، آنگاه \(x\) و \(x+u\) دقیقاً \(1\) از هم فاصله دارند. به طور خاص، برای مثال، نقاط در ... قرار دارند.

\[
0
\quad\text{und}\quad
\frac35+\frac45i
\]

دقیقاً به اندازه یک واحد از هم فاصله دارند. بنابراین، یک عبارت نظریه اعداد، یک جهت هندسی به طول \(1\) را به دست می‌دهد. این هنوز اثبات نقض بزرگ نیست، اما نسخه کوچک این ترفند است: نه تنها می‌توان به دنبال فواصل واحد افقی و عمودی مانند شبکه بود، بلکه باید به دنبال جهات زیادی بود که به صورت حسابی تولید شده‌اند و همه آنها دقیقاً طول \(1\) دارند.

ساختار واقعی از ابزارهای بسیار قدرتمندتری استفاده می‌کند. به جای کار فقط با اعداد صحیح گاوسی \(\mathbb{Z}[i]\) ، اثبات از میدان‌های اعداد جبری پیچیده‌تر \(K=L(i)\) استفاده می‌کند. در آنجا، عناصر زیادی از فرم

\[
u=\frac{\alpha}{c(\alpha)}
\]

ساخته شده است، که در آن \(c\) نقش مزدوج مختلط را ایفا می‌کند. تأثیر اساسی این است: در میان تعبیه‌های مختلط مربوطه، این \(u\) هر کدام دارای بزرگی \(1\) هستند. بنابراین، آنها کاندیدای بسیاری از جهات واحد مختلف هستند.

به طور خیلی کلی، یک مثال نقض واقعی شبیه یک تصویر کوچک و زیبا با ده نقطه نیست، بلکه شبیه یک گروه بزرگ و حساب‌شده از نقاط است. شما یک شبکه با ابعاد بالا برمی‌دارید، نقاط مناسبی را از آن جدا می‌کنید و سپس آنها را روی صفحه معمولی تصویر می‌کنید. در نمادگذاری اثبات، این تقریباً به شکل ... بیان می‌شود.

\[
P_j=\pi_1\big((y+\Lambda_j)\cap W\big),
\]

به عبارت دیگر: نقاطی از یک شبکه جابجا شده \(y+\Lambda_j\) گرفته می‌شود، آنها را به ناحیه \(W\) محدود می‌کند و آنها را با \(\pi_1\) بر روی یک مختصات مختلط، یعنی بر روی \(\mathbb{C}\cong\mathbb{R}^2\) تصویر می‌کند. بسیاری از تفاوت‌های بین این نقاط دقیقاً عناصر \(u\) با بزرگی \(1\) هستند. بنابراین، پس از تصویرسازی، آنها به فواصل واحد واقعی در صفحه تبدیل می‌شوند.

یک قیاس بصری این است: شبکه استاندارد از چند جهت ساده مانند راست، چپ، بالا و پایین استفاده می‌کند. با این حال، ساختار جدید تعداد زیادی جهت پنهان مشتق شده از نظریه اعداد جبری ایجاد می‌کند. هر جهت دقیقاً یک واحد طول دارد. از آنجا که تعداد زیادی از این جهات وجود دارد و نقاط زیادی با آنها مطابقت دارند، کل فواصل واحد بیشتر از آن چیزی است که حدس قدیمی اجازه می‌داد.

همچنین قابل توجه است که اثبات از کجا آمده است. طبق گفته OpenAI، راه حل به طور خودکار توسط یک مدل استدلال عمومی پیدا شده است، نه توسط یک سیستم ریاضی که به طور خاص برای این مسئله آموزش دیده است. سپس اثبات به صورت داخلی و خارجی بررسی شده و به شکلی قابل خواندن برای انسان ارائه شده است. یادداشت‌های همراه از ریاضیدانان خارجی نیز تأکید می‌کنند که این فقط یک نسخه خودکار از یک روش شناخته شده نیست، بلکه یک ارتباط غیرمنتظره بین هندسه گسسته و نظریه اعداد جبری است.

احتمالاً دلیل واقعی جذابیت این نتیجه همین است. مسئله فقط حل صحیح یک مسئله توسط هوش مصنوعی نیست. بلکه یافتن راهی است که برای بسیاری از مردم آشکار نبوده است: پرداختن به یک مسئله هندسی در مورد فواصل در یک صفحه با ابزارهای عمیق از نظریه اعداد. این موضوع ریاضیات را کمتر انسانی نمی‌کند. اما یک رقیب جدید و نسبتاً قدرتمند به آن می‌دهد.

بازگشت