IA contre Erdős

Certains problèmes mathématiques sont formulés avec une telle simplicité qu'ils peuvent être expliqués à un enfant, et pourtant avec une telle difficulté qu'ils mobilisent des générations de mathématiciens. Le problème de la distance unitaire en est un exemple : étant donné \(n\) points dans le plan, combien de paires de points peuvent avoir une distance exactement égale à \(1\) ? Ce problème remonte à Paul Erdős et est étudié depuis 1946. OpenAI vient de publier les résultats d'un modèle interne qui a invalidé une conjecture longtemps admise à son sujet.


À première vue, la question semble anodine. Si l'on place \(n\) points sur une droite, on obtient approximativement \(n-1\) intervalles de longueur \(1\) . Si l'on dispose les points sous forme de grille, comme sur du papier millimétré, on obtient un nombre nettement supérieur de ces intervalles : horizontalement et verticalement entre les points adjacents. Erdős avait déjà trouvé des constructions légèrement plus performantes que la méthode linéaire. Pendant longtemps, cependant, on a cru qu'il était impossible de faire beaucoup mieux. Formellement, l'hypothèse était que le nombre maximal de tels intervalles unitaires ne croissait qu'approximativement en \(n^{1+o(1)}\) , c'est-à-dire un peu plus vite qu'en \(n\) , mais sans exposant supplémentaire fixe.

C’est précisément là le point surprenant : le modèle d’OpenAI (dont le nom n’a pas été divulgué) a construit non pas un simple contre-exemple, mais une famille infinie d’ensembles de points \(P\) pour lesquels le nombre de distances unitaires est au moins égal à \(|P|^{1+\delta}\) , avec un \(\delta>0\) fixé. Un raffinement ultérieur de Will Sawin, toujours selon OpenAI, aboutit même à \(\delta=0{,}014\) . Cela paraît peu, mais représente mathématiquement un gain considérable : il ne s’agit plus d’un reste logarithmique, mais d’un véritable gain polynomial.

Un exemple simple illustre l'idée de base. Prenons le nombre complexe

\[
u=\frac{2+i}{2-i}=\frac{3+4i}{5}=\frac35+\frac45i.
\]

Ce nombre a une valeur absolue de \(1\) , car

\[
\left|\frac35+\frac45i\right|=\sqrt{\left(\frac35\right)^2+\left(\frac45\right)^2}=1.
\]

Par conséquent, si \(x\) est un point du plan, alors \(x\) et \(x+u\) sont distants exactement \(1\) . Plus précisément, par exemple, les points sont situés à...

\[
0
\quad\text{und}\quad
\frac35+\frac45i
\]

exactement une unité d'écart. Une expression arithmétique donne ainsi une direction géométrique de longueur \(1\) . Ce n'est pas encore la démonstration ultime, mais une version simplifiée de l'astuce : on ne recherche pas seulement des distances unitaires horizontales et verticales comme dans la grille, mais de nombreuses directions générées arithmétiquement, toutes de longueur exactement \(1\) .

La construction proprement dite utilise des outils nettement plus puissants. Au lieu de se limiter aux entiers de Gauss \(\mathbb{Z}[i]\) , la démonstration fait appel à des corps de nombres algébriques plus complexes \(K=L(i)\) . On y trouve de nombreux éléments de la forme

\[
u=\frac{\alpha}{c(\alpha)}
\]

construit, où \(c\) joue le rôle de conjugaison complexe. L'effet crucial est le suivant : parmi les plongements complexes pertinents, ces \(u\) ont chacun une magnitude de \(1\) . Ils sont donc candidats pour de nombreuses directions unitaires différentes.

En termes très simplifiés, un véritable contre-exemple ne ressemble pas à une petite image simple avec dix points, mais plutôt à un immense essaim de points construit arithmétiquement. On part d'une grille multidimensionnelle, on en extrait des points pertinents, puis on les projette sur le plan ordinaire. En notation de démonstration, cela s'exprime approximativement sous la forme…

\[
P_j=\pi_1\big((y+\Lambda_j)\cap W\big),
\]

Autrement dit : on prend des points d’une grille décalée \(y+\Lambda_j\) , on les restreint à une région \(W\) , et on les projette avec \(\pi_1\) sur un repère complexe, c’est-à-dire sur \(\mathbb{C}\cong\mathbb{R}^2\) . De nombreuses différences entre ces points sont alors précisément de tels éléments \(u\) de magnitude \(1\) . Par conséquent, après la projection, elles deviennent de véritables distances unitaires dans le plan.

On peut l'illustrer par une analogie visuelle : la grille standard utilise quelques directions simples, comme droite, gauche, haut et bas. La nouvelle construction, en revanche, génère un grand nombre de directions cachées, issues de la théorie algébrique des nombres. Chaque direction mesure exactement une unité. Du fait de ce grand nombre de directions et du grand nombre de points qui leur correspondent, la distance totale entre les unités est supérieure à ce que la conjecture précédente laissait supposer.

Il est également intéressant de noter l'origine de la démonstration. Selon OpenAI, la solution a été trouvée de manière autonome par un modèle de raisonnement général, et non par un système mathématique spécifiquement entraîné pour ce problème. La démonstration a ensuite été vérifiée en interne et en externe, puis présentée sous une forme lisible par l'humain. Les notes d'accompagnement, rédigées par des mathématiciens externes, soulignent également qu'il ne s'agit pas simplement d'une version automatisée d'une méthode connue, mais d'un lien inattendu entre la géométrie discrète et la théorie algébrique des nombres.

C’est probablement la véritable raison pour laquelle ce résultat est si intéressant. Il ne s’agit pas simplement d’une IA qui résout un problème correctement, mais d’une IA qui trouve une solution qui n’était pas évidente pour beaucoup : aborder un problème géométrique de distances dans un plan grâce à des outils complexes de la théorie des nombres. Cela ne rend pas les mathématiques moins humaines pour autant, mais leur confère un nouvel adversaire, d’une puissance redoutable.

Retour