AI vs. Erdős

சில கணிதச் சிக்கல்கள் ஒரு குழந்தைக்கு விளக்கக்கூடிய அளவுக்கு எளிமையாக வடிவமைக்கப்பட்டுள்ளன, ஆனாலும் அவை பல தலைமுறை கணிதவியலாளர்களை ஈடுபடுத்தும் அளவுக்குக் கடினமானவை. அத்தகைய ஒரு சிக்கல்தான் அலகு தூரச் சிக்கல் என அழைக்கப்படுகிறது: ஒரு தளத்தில் \(n\) புள்ளிகளை வைக்கவும். அப்போது, சரியாக \(1\) என்ற தூரத்தைக் கொண்டிருக்கக்கூடிய புள்ளி இணைகள் எத்தனை? இந்தச் சிக்கல் பால் எர்டோஸ் காலத்திலிருந்து இருந்து வருகிறது, மேலும் இது 1946 முதல் ஆய்வு செய்யப்பட்டு வருகிறது. தற்போது OpenAI நிறுவனம், ஒரு உள் மாதிரி இந்தச் சிக்கலைப் பற்றிய நீண்டகால ஊகத்தை தவறென நிரூபித்துள்ளதாக வெளியிட்டுள்ளது.


முதல் பார்வையில், இந்தக் கேள்வி பாதிப்பில்லாததாகத் தோன்றுகிறது. நீங்கள் ஒரு நேர்கோட்டில் \(n\) புள்ளிகளை வைத்தால், தோராயமாக \(n-1\) இடைவெளிகள் கிடைக்கும், அவற்றின் நீளம் \(1\) . வரைபடத் தாளில் உள்ளது போல, புள்ளிகளை ஒரு கட்டமாக அமைத்தால், அருகருகே உள்ள புள்ளிகளுக்கு இடையில் கிடைமட்டமாகவும் செங்குத்தாகவும் கணிசமாக அதிகமான இந்த இடைவெளிகள் கிடைக்கும். எர்டோஸ் ஏற்கெனவே நேரியல் முறையை விட சற்றே சிறந்த கட்டமைப்புகளைக் கண்டறிந்திருந்தார். இருப்பினும், நீண்ட காலமாக, இதை குறிப்பிடத்தக்க அளவில் மேம்படுத்த முடியாது என்று நம்பப்பட்டது. முறையாக, அத்தகைய அலகு இடைவெளிகளின் அதிகபட்ச எண்ணிக்கை தோராயமாக \(n^{1+o(1)}\) மட்டுமே வளரும், அதாவது \(n\) விட சற்றே வேகமாக வளரும், ஆனால் ஒரு நிலையான கூடுதல் அடுக்குடன் அல்ல என்பதே அனுமானமாக இருந்தது.

துல்லியமாக இதுதான் ஆச்சரியமான விஷயம்: OpenAI மாதிரி (அது எதுவென்று வெளியிடப்படவில்லை) ஒரு ஒற்றை எதிர் உதாரணத்தை மட்டுமல்ல, நிலையான \(\ \(\delta>0\) உடன், அலகு தூரங்களின் எண்ணிக்கை குறைந்தபட்சம் \(|P|^{1+\delta}\) இருக்கும் புள்ளித் தொகுப்புகளின் \(P\) ஒரு முடிவிலா குடும்பத்தை உருவாக்கியது. OpenAI-இன் படி, வில் சாவின் செய்த பிற்காலச் செம்மைப்படுத்தல் \(\delta=0{,}014\) என்ற மதிப்பைக் கூட அளிக்கிறது. இது சிறியதாகத் தோன்றினாலும், கணிதரீதியாக இது மிகப்பெரியது: இது இனி ஒரு மடக்கை மீதம் அல்ல, மாறாக ஒரு உண்மையான பல்லுறுப்புக் கோவையின் ஆதாயம் ஆகும்.

ஒரு எளிய உதாரணம் அடிப்படைக் கருத்தை விளக்குகிறது. சிக்கலெண்ணைக் கருத்தில் கொள்வோம்.

\[
u=\frac{2+i}{2-i}=\frac{3+4i}{5}=\frac35+\frac45i.
\]

இந்த எண்ணின் தனிமதிப்பு \(1\) ஆகும், ஏனெனில்

\[
\left|\frac35+\frac45i\right|=\sqrt{\left(\frac35\right)^2+\left(\frac45\right)^2}=1.
\]

எனவே, \(x\) என்பது தளத்தில் உள்ள ஒரு புள்ளி எனில், \(x\) மற்றும் \(x+u\) ஆகியவை சரியாக \(1\) இடைவெளியில் உள்ளன. குறிப்பாக, எடுத்துக்காட்டாக, புள்ளிகள் ... இல் அமைந்துள்ளன.

\[
0
\quad\text{und}\quad
\frac35+\frac45i
\]

சரியாக ஒரு அலகு இடைவெளியில். இவ்வாறு ஒரு எண்-கோட்பாட்டு வெளிப்பாடு, நீளம் \(1\) கொண்ட ஒரு வடிவியல் திசையை அளிக்கிறது. இது இன்னும் மாபெரும் எதிர்-நிரூபணம் அல்ல, ஆனால் இது தந்திரத்தின் சிறிய பதிப்பாகும்: கட்டத்தில் உள்ளதைப் போல கிடைமட்ட மற்றும் செங்குத்து அலகு தூரங்களை மட்டும் பார்க்காமல், எண்கணித ரீதியாக உருவாக்கப்பட்ட பல திசைகளையும் பார்க்க வேண்டும், அவை அனைத்தும் சரியாக நீளம் \(1\) கொண்டவை.

உண்மையான கட்டுமானம் கணிசமாக அதிக சக்திவாய்ந்த கருவிகளைப் பயன்படுத்துகிறது. காஸியன் முழு எண்களுடன் \(\mathbb{Z}[i]\) மட்டும் செயல்படுவதற்குப் பதிலாக, இந்த நிரூபணம் மிகவும் சிக்கலான இயற்கணித எண் புலங்களான \(K=L(i)\) பயன்படுத்துகிறது. அங்கே, வடிவத்தின் பல கூறுகள் உள்ளன.

\[
u=\frac{\alpha}{c(\alpha)}
\]

கட்டமைக்கப்பட்டது, இதில் \(c\) சிக்கலான இணைவின் பாத்திரத்தை வகிக்கிறது. முக்கியமான விளைவு என்னவென்றால்: தொடர்புடைய சிக்கலான உட்பொதிவுகளில், இந்த \(u\) ஒவ்வொன்றும் \(1\) என்ற அளவைக் கொண்டுள்ளன. எனவே அவை பல வெவ்வேறு அலகு திசைகளுக்கான வேட்பாளர்களாக உள்ளன.

மிகவும் எளிமையாகச் சொல்வதானால், ஒரு உண்மையான எதிர் உதாரணம் என்பது பத்து புள்ளிகளைக் கொண்ட ஒரு சிறிய, அழகான படம் போல இருக்காது, மாறாக, கணிதரீதியாக உருவாக்கப்பட்ட ஒரு பிரம்மாண்டமான புள்ளிக் கூட்டம் போல இருக்கும். நீங்கள் ஒரு உயர்-பரிமாணக் கட்டத்தை எடுத்து, அதிலிருந்து பொருத்தமான புள்ளிகளை வெட்டி எடுத்து, பின்னர் அவற்றை மீண்டும் சாதாரண தளத்தின் மீது படியவைக்கிறீர்கள். நிரூபணக் குறியீட்டில், இது தோராயமாக இந்த வடிவத்தில் வெளிப்படுத்தப்படுகிறது...

\[
P_j=\pi_1\big((y+\Lambda_j)\cap W\big),
\]

வேறுவிதமாகக் கூறினால்: ஒருவர் நகர்த்தப்பட்ட கட்டம் \(y+\Lambda_j\) இலிருந்து புள்ளிகளை எடுத்து, அவற்றை ஒரு பகுதி \(W\) ஆல் கட்டுப்படுத்தி, பின்னர் அவற்றை \(\pi_1\) உடன் ஒரு சிக்கலெண் ஆயத்தின் மீது, அதாவது \(\mathbb{C}\cong\mathbb{R}^2\) மீது வீழ்த்துகிறார். இந்தப் புள்ளிகளுக்கு இடையேயான பல வேறுபாடுகள், பின்னர் துல்லியமாக \(1\) அளவு கொண்ட அத்தகைய \(u\) கூறுகளாக இருக்கின்றன. எனவே, வீழ்த்தலுக்குப் பிறகு, அவை தளத்தில் உண்மையான அலகு தூரங்களாக மாறுகின்றன.

ஒரு காட்சி ஒப்புமை இதுதான்: வழக்கமான கட்டமைப்பு, வலது, இடது, மேல் மற்றும் கீழ் போன்ற சில எளிய திசைகளைப் பயன்படுத்துகிறது. ஆனால், இந்தப் புதிய கட்டமைப்பு, இயற்கணித எண் கோட்பாட்டிலிருந்து பெறப்பட்ட எண்ணற்ற மறைவான திசைகளை உருவாக்குகிறது. ஒவ்வொரு திசையும் சரியாக ஓர் அலகு நீளம் கொண்டது. இத்தகைய திசைகள் மிக அதிகமாக இருப்பதாலும், பல புள்ளிகள் அவற்றுடன் பொருந்துவதாலும், மொத்த அலகு தூரங்கள், பழைய அனுமானம் அனுமதித்ததை விட அதிகமாக உள்ளன.

இந்த நிரூபணம் எங்கிருந்து வருகிறது என்பதும் குறிப்பிடத்தக்கது. OpenAI-இன் படி, இந்தத் தீர்வு இந்தப் பிரச்சனைக்காக பிரத்யேகமாகப் பயிற்றுவிக்கப்பட்ட ஒரு கணித அமைப்பால் அல்லாமல், ஒரு பொதுவான பகுத்தறிவு மாதிரியால் தன்னிச்சையாகக் கண்டறியப்பட்டது. பின்னர் அந்த நிரூபணம் உள் மற்றும் வெளி ரீதியாக மதிப்பாய்வு செய்யப்பட்டு, மனிதர்களால் படிக்கக்கூடிய வடிவத்தில் மாற்றப்பட்டது. வெளி கணிதவியலாளர்களின் அதனுடன் இணைந்த குறிப்புகளும், இது அறியப்பட்ட ஒரு முறையின் தானியங்குப் பதிப்பு மட்டுமல்ல, தனித்த வடிவியல் மற்றும் இயற்கணித எண் கோட்பாடு ஆகியவற்றுக்கு இடையேயான ஒரு எதிர்பாராத தொடர்பு என்பதையும் வலியுறுத்துகின்றன.

இந்த முடிவு இவ்வளவு சுவாரஸ்யமாக இருப்பதற்கு இதுதான் உண்மையான காரணமாக இருக்கலாம். இது வெறும் ஒரு செயற்கை நுண்ணறிவு ஒரு சிக்கலைச் சரியாகத் தீர்ப்பது பற்றியது மட்டுமல்ல. பலருக்கு வெளிப்படையாகத் தெரியாத ஒரு வழியை அது கண்டுபிடிப்பது பற்றியது: அதாவது, எண் கோட்பாட்டின் ஆழமான கருவிகளைக் கொண்டு ஒரு தளத்தில் உள்ள தூரங்கள் பற்றிய வடிவியல் சிக்கலைக் கையாள்வது. இது கணிதத்தை எந்த வகையிலும் மனிதத்தன்மையற்றதாக ஆக்கிவிடாது. ஆனால், அது கணிதத்திற்கு ஒரு புதிய, சற்றே அசௌகரியமான சக்திவாய்ந்த எதிராளியை அளிக்கிறது.

மீண்டும்