Trí tuệ nhân tạo đấu với Erdős

Một số bài toán toán học được trình bày đơn giản đến mức có thể giải thích cho một đứa trẻ, nhưng lại khó đến nỗi chúng làm việc cho nhiều thế hệ các nhà toán học. Một bài toán như vậy là bài toán khoảng cách đơn vị: Đặt \(n\) điểm trên mặt phẳng. Hỏi có bao nhiêu cặp điểm có khoảng cách chính xác bằng \(1\) ? Bài toán này bắt nguồn từ Paul Erdős và đã được nghiên cứu từ năm 1946. OpenAI vừa công bố rằng một mô hình nội bộ đã bác bỏ một giả thuyết lâu đời về bài toán này.


Thoạt nhìn, câu hỏi nghe có vẻ vô hại. Nếu bạn đặt \(n\) điểm trên một đường thẳng, bạn sẽ nhận được khoảng \(n-1\) khoảng có độ dài \(1\) . Nếu bạn sắp xếp các điểm thành một lưới, giống như trên giấy kẻ ô, bạn sẽ nhận được nhiều khoảng như vậy hơn đáng kể: theo chiều ngang và chiều dọc giữa các điểm liền kề. Erdős đã tìm ra những cách xây dựng tốt hơn một chút so với đường thẳng. Tuy nhiên, trong một thời gian dài, người ta tin rằng điều này không thể được cải thiện đáng kể. Về mặt hình thức, giả định là số lượng tối đa các khoảng đơn vị như vậy chỉ tăng khoảng \(n^{1+o(1)}\) , tức là nhanh hơn một chút so với \(n\) , nhưng không phải với một số mũ bổ sung cố định.

Đây chính là điểm đáng ngạc nhiên: Mô hình OpenAI (mô hình nào thì không được tiết lộ) không chỉ xây dựng một ví dụ phản chứng duy nhất, mà là một họ vô hạn các tập hợp điểm \(P\) mà trong đó số lượng khoảng cách đơn vị ít nhất là \(|P|^{1+\delta}\) , với \(\delta>0\) cố định. Theo OpenAI, một cải tiến sau đó của Will Sawin thậm chí còn cho ra \(\delta=0{,}014\) . Con số này nghe có vẻ nhỏ, nhưng về mặt toán học lại vô cùng lớn: Nó không còn là phần dư logarit nữa, mà là một lợi ích đa thức thực sự.

Một ví dụ đơn giản minh họa ý tưởng cơ bản. Hãy xem xét số phức.

\[
u=\frac{2+i}{2-i}=\frac{3+4i}{5}=\frac35+\frac45i.
\]

Số này có giá trị tuyệt đối bằng \(1\) , bởi vì

\[
\left|\frac35+\frac45i\right|=\sqrt{\left(\frac35\right)^2+\left(\frac45\right)^2}=1.
\]

Do đó, nếu \(x\) là một điểm trong mặt phẳng, thì \(x\)\(x+u\) cách nhau đúng \(1\) . Cụ thể, ví dụ, các điểm nằm ở...

\[
0
\quad\text{und}\quad
\frac35+\frac45i
\]

cách nhau chính xác một đơn vị. Một biểu thức lý thuyết số do đó tạo ra một hướng hình học có độ dài \(1\) . Đây chưa phải là bằng chứng phản bác lớn, nhưng đó là phiên bản nhỏ của thủ thuật: người ta không chỉ tìm kiếm khoảng cách đơn vị theo chiều ngang và chiều dọc như trong lưới, mà còn tìm kiếm nhiều hướng được tạo ra theo số học, tất cả đều có độ dài chính xác \(1\) .

Quá trình xây dựng thực tế sử dụng các công cụ mạnh mẽ hơn đáng kể. Thay vì chỉ làm việc với các số nguyên Gauss \(\mathbb{Z}[i]\) , bằng chứng sử dụng các trường số đại số phức tạp hơn \(K=L(i)\) . Ở đó, nhiều phần tử có dạng

\[
u=\frac{\alpha}{c(\alpha)}
\]

được xây dựng, trong đó \(c\) đóng vai trò liên hợp phức. Hiệu ứng quan trọng là: trong số các phép nhúng phức liên quan, mỗi \(u\) này đều có độ lớn là \(1\) . Do đó, chúng là ứng cử viên cho nhiều hướng đơn vị khác nhau.

Nói một cách khái quát, một ví dụ phản chứng thực sự không giống như một bức tranh nhỏ xinh với mười chấm, mà giống như một đám chấm khổng lồ được xây dựng bằng toán học. Bạn lấy một lưới đa chiều, cắt ra các điểm thích hợp từ đó, và sau đó chiếu các điểm này trở lại mặt phẳng thông thường. Trong ký hiệu chứng minh, điều này được biểu diễn đại khái dưới dạng...

\[
P_j=\pi_1\big((y+\Lambda_j)\cap W\big),
\]

Nói cách khác: Ta lấy các điểm từ một lưới dịch chuyển \(y+\Lambda_j\) , giới hạn chúng trong một vùng \(W\) , và chiếu chúng với \(\pi_1\) lên một hệ tọa độ phức, tức là lên \(\mathbb{C}\cong\mathbb{R}^2\) . Nhiều hiệu số giữa các điểm này sau đó chính xác là các phần tử \(u\) có độ lớn \(1\) . Do đó, sau phép chiếu, chúng trở thành khoảng cách đơn vị thực sự trong mặt phẳng.

Một ví dụ trực quan như sau: Hệ tọa độ chuẩn sử dụng một vài hướng đơn giản, chẳng hạn như phải, trái, lên và xuống. Tuy nhiên, cấu trúc mới tạo ra một số lượng lớn các hướng ẩn được suy ra từ lý thuyết số đại số. Mỗi hướng có chiều dài chính xác là một đơn vị. Bởi vì có rất nhiều hướng như vậy và nhiều điểm tương ứng với chúng, tổng khoảng cách đơn vị lớn hơn so với giả thuyết cũ cho phép.

Điều đáng chú ý nữa là nguồn gốc của bằng chứng này. Theo OpenAI, lời giải được tìm ra một cách tự động bởi một mô hình suy luận tổng quát, chứ không phải bởi một hệ thống toán học được huấn luyện đặc biệt cho vấn đề này. Sau đó, bằng chứng đã được xem xét nội bộ và bên ngoài, rồi được trình bày dưới dạng dễ hiểu đối với con người. Các ghi chú kèm theo từ các nhà toán học bên ngoài cũng nhấn mạnh rằng đây không chỉ là một phiên bản tự động của một phương pháp đã biết, mà còn là một mối liên hệ bất ngờ giữa hình học rời rạc và lý thuyết số đại số.

Đây có lẽ là lý do thực sự khiến kết quả này thú vị đến vậy. Nó không chỉ đơn thuần là việc một AI giải quyết vấn đề một cách chính xác. Mà còn là việc nó tìm ra một cách tiếp cận mà nhiều người không nghĩ tới: giải quyết một bài toán hình học về khoảng cách trong mặt phẳng bằng các công cụ chuyên sâu từ lý thuyết số. Điều này không làm cho toán học trở nên kém tính nhân văn hơn. Nhưng nó lại mang đến cho toán học một đối thủ mới, mạnh mẽ đến mức đáng lo ngại.

Trở lại