OpenAI模型声称攻克埃尔德什难题

Ars Technica AI·6月1日 19:00 UTC·作者 Ars Contributors

关键信息

蒂姆·高尔斯将这一解答称为AI数学中的一个里程碑，而丹尼尔·利特则表示，这是他第一次把一项由AI自主产生的结果本身就视为令人兴奋的成果。文章还指出，这个证明借用了多个数学分支中的既有思想，并没有提出根本性的新技术，之后还被人类数学家整理和扩展。

资讯摘要

OpenAI在5月中旬宣布，其内部模型已经推翻了埃尔德什单位距离猜想，这是离散几何中的一个长期难题。这个说法之所以重要，是因为该猜想大约80年来一直没有被解决，被视为典型的高难度数学问题。OpenAI随后让几位数学家提前查看了结果，并公开了他们的反馈。菲尔兹奖得主蒂姆·高尔斯表示，单位距离问题的解法无疑是AI数学中的一个里程碑。

多伦多大学教授丹尼尔·利特则说，这是他第一次把一项由AI自主产生的结果本身就看作令人兴奋的成果，而不只是未来进步的前兆。文章认为，这很可能是AI系统第一次找到能够解决重大公开猜想的证明，但它并没有把这看作与过去AI数学进展完全断裂的事件。三年前，大语言模型还难以处理算术题，而直到去年它们才开始在高中数学竞赛中表现出色。作者将这项新成果描述为这一演进过程中的下一步：模型综合了数学多个分支的既有思想构建出完整证明，而人类数学家随后又对其进行了整理和扩展。

资讯正文

5月中旬，OpenAI宣布，一款内部AI模型已经推翻了厄尔德什单位距离猜想，这是离散几何领域一个著名的问题，在过去80年里一直困扰着人类数学家。

OpenAI向几位数学家提前披露了这一结果，并公布了他们的反应。曾获得数学界最负盛名的菲尔兹奖的Tim Gowers写道：“毫无疑问，单位距离问题的解答是AI数学中的一个里程碑。”

多伦多大学教授Daniel Litt写道：“这是我第一次看到一个由AI自主产生的结果，它本身就让我感到兴奋，而不只是因为它是一个领先指标。”

可以说，这是AI系统第一次找到一个证明，解决了一个重大的公开猜想。这很了不起，但我并不认为这与AI在数学领域此前的发展轨迹有着根本性的断裂。

三年前，大语言模型（LLM）还很难解决算术题。直到去年，LLM才开始在高中数学竞赛中屡屡拿高分。

今年1月，当我参加全球最大的年度数学会议——联合数学会议（Joint Mathematics Meetings）时，我了解到AI系统已经开始为数学研究作出贡献，但只是在受限的场景下。要把AI输出转化为可发表的定理，仍需要大量的人类解读。

OpenAI这项新成果是这一进程中的下一步。该AI模型巧妙地运用了来自数学多个子领域的既有思想，构造出了一份完整证明。但它并没有首创任何真正新的技术。此后，这一结果已被人类数学家整理并扩展。

这指向了一个中期未来：人类数学家与AI模型将彼此互补。AI对既往工作的了解比任何在世的人都更广，而且也更愿意去反复尝试那些费时费力、但很可能行不通的证明策略。不过，人类仍然能够对任何一个问题进行更深入的思考，并提出更有意思的问题。

但这种局面未必会持续太久。AI系统在数学上的进步速度如此之快，以至于十年后人类数学家究竟还会扮演什么角色，甚至是否仍有角色，都还不清楚。

单位距离问题

保罗·厄尔德什（Paul Erdős）是历史上最富产的数学家之一。他一生发表了1500多篇论文，这是有史以来最多的。他最杰出的才能之一，就是提出那些表述简单、却有深厚根基的问题。

1946年，他提出了单位距离问题。设想你在二维平面上有一些点，并测量每一对点之间的距离：

Credit:

Kai Williams / Understanding AI Credit:

Kai Williams / Understanding AI

在这张图中，有五个点和十对点。其中三对点的距离恰好为1个单位：AD、BE和CE。

我们能否重新排列这些点，让更多的点对之间恰好相距1个单位？

可以。比如，我们可以把A点和D点移动得更靠近B、C和E的点簇。再多做一些工作，我们还可以进一步重新排列这些点，使得有七对点的距离恰好为1个单位。但这已经是我们能做到的极限了。

我们也可以用 6 个点、7 个点，依此类推来做同样的分析。但随着点数增加，问题很快就会变得过于复杂，无法求出精确答案。

因此，Erdős 并没有去问在给定点数下究竟能有多少个单位距离，而是试图在 n 个点的情况下计算长度为 1 的线段数量的上界和下界，假设 n 是一个很大的数。

为了帮助计算下界，Erdős 假设这些点会按网格排列。这大概不是最优布局，但如果他能够证明网格中的点有一定数量的单位距离点对，那么最优排列至少也必须有这么多。

最简单的做法，是把网格间距设成这样：每个点与其正上方、正下方、左边和右边的邻点距离都是 1。不过，Erdős 发现，如果把对角线也考虑进去，效果会更好。若把网格间距缩小，就能让每个点与更多邻点的距离变成 1。在上面的示意图中，如果网格间距为 1，那么每个点都与 4 个邻点相距 1（左图）。而如果网格间距为 ⅕（如右图所示），那么每个点都与 12 个邻点相距 1：

OpenAI 对其新结果的说明中附带了一张令人困惑的图，图里是网格中的点，以及连接它们的一堆线。如果像这样叠加一个圆，图就更容易理解了：

之所以有效，是因为勾股定理：如果一个点在另一个点的右边 a 个单位、上方 b 个单位，那么这两个点之间的距离 c 满足 a² + b² = c²。诀窍在于选取某个 c²，使得存在很多组整数 a 和 b 满足 a² + b² = c²。然后，如果把网格按比例缩小到每个点与邻点的距离为 1/c，就会出现很多个单位距离。

例如，如果我们选择 c² = 25，那么勾股方程可以由 0² + 5² = 25 或 3² + 4² = 25 来满足。这对应于我前面展示的 12 个网格点圆，点的位置包括 (0,5)、(3,4)、(4,3)、(5,0)、(-4,3)、(-3,4) 等等。（严格来说，这些长度都应该除以 5——例如 (⅗, ⅘)——但为了清楚起见，我这里省略了分母。）

OpenAI 的图示基于选择 c² = 65，它可以由 1² + 8² = 65 或 4² + 7² = 65 来满足。这意味着，如果网格间距是 1/√65，那么每个点都将与另外 16 个点相距 1：(1,8)、(4,7)、(7,4)、(8,1)、(-1,8)、(-4,7) 等等。若能谨慎选择更大的 c² 值，就能得到更多的整数对角线，从而产生更多的单位距离点对。

不过，如果 c² 相对于网格中的点数来说太大，那么许多可能相距 1 的邻点就会落到网格之外。

简而言之，我们希望选择一个足够大、但又不要太大的 c²。借助数论中的一些见解，包括 Jacobi 的两平方定理，Erdős 证明了，一个大小最合适的圆可以让单位距离点对的数量增长得比点数更快，但也只是勉强快一点。

问题变成了“你能做得更好吗？”为了寻找一个上界，埃尔德什（Erdős）借用了数学中一个截然不同的领域——图论——中的论证，证明单位距离的数量不可能无限增加，只能有那么多。但他的上界增长得要比他能够构造出的最佳下界快得多，快很多很多。

埃尔德什的猜想是，真实的最优值会比下界更接近下界，而不是接近上界。他预测，但无法证明，单位距离对的最大数量增长得只会比点的数量略快一点。

更准确地说，埃尔德什猜想单位距离的数量会是 n^(1+o(1))。换句话说，对于足够大的 n，单位距离的最大数量会小于任意 𝜖 > 0 时的 n^(1+𝜖)。这最终可能会比他构造的下界——即 n^(1 + C/(log log n))，其中 C 是某个常数——增长得稍快一些，但仍然处在同一个大致范围内。

证明他的猜想后来被称为单位距离问题。在接下来的 80 年里，看起来埃尔德什是对的。

然后，一个 OpenAI 模型证明他错了。

AI 的方法

埃尔德什的猜想假定，至少对于大量点而言，正方形网格所能产生的单位距离对数量，大致可以与用其他方式组织这些点得到的数量相当。OpenAI 的 AI 通过证明存在另一种更复杂的组织 n 个点的方式，可以让更多点对之间的距离恰好为一个单位，从而推翻了这一假设。

正因为这种新的点阵模式更复杂，要简洁地解释它并不容易。但你可以把它理解为对埃尔德什网格的一种巧妙改造。

这个 AI 先在高维空间中构造了一个网格，然后把这个更复杂的结构投影到二维。并且，它没有使用像 (1,3) 或 (-3,6) 这样的整数坐标网格，而是使用了所谓的代数整数来构建这种更复杂的网格。事实证明，这类高维网格具有更丰富的结构，因此 AI 能在相同数量的点中塞入更多单位距离。

要把这种替代性的点排列方式画出来并不容易，因为它只有在点数非常大的时候才会体现出优势。不过，这里有一种以类似方式构造出的更简单的点排列。你可以点击这里，亲自操作一下这个示意图。

它有 1,345 个点，只产生 5,916 条单位距离，少于使用埃尔德什方法构造的 1,296 点正方形网格所产生的 7,632 条单位距离。但我认为，它有助于说明：一种并非网格的模式，也可能比正方形网格产生更多单位距离。

更复杂的模式确实有回报。虽然 OpenAI 模型的证明并没有明确说明对于 n 个点可以有多少个单位距离对，但人类数学家 Will Sawin 已经能够证明，它至少以 n 1.014 的速度增长。这个数字看起来也许不大，但当 n 变得真正巨大时，它会比埃尔德什方法得到的计数大得多。

话虽如此，AI 的结果并没有彻底解决这个问题。我们目前对单位距离数量的最佳上界大约是 n 1.333 。还需要更多工作来缩小这个差距。

这个结果在数学领域的 AI 进展中处于什么位置？

如果你在两周前——也就是 OpenAI 公布消息之前——问我，LLM 对数学最具创新性的贡献是什么，我大概会提到 Google DeepMind 的 AlphaEvolve 系统。

AlphaEvolve 利用 LLM 作为优化过程的引擎。如果你能把一个数学问题转化为一段可供优化的代码——而这类情况其实并不少见——那么 LLM 也许就能在某些类型的问题上找到比人类更好的解法。11 月，四位数学家（包括 Terence Tao）发表了一篇论文，分析了 AlphaEvolve 在数学文献中 67 个优化问题上的表现。他们发现，在某些情况下，AlphaEvolve 能够改进既有文献中的结果。

这比以往 LLM 的贡献——比如文献综述——在自主性上更进一步，但它仍然需要人类先把问题框定为优化问题，再把 AI 的输出转化为可用的数学成果。而且，只有某些类型的问题适合这种方法。那些不包含可优化数值的、更偏概念性的问题，无法轻易用 AlphaEvolve 来研究。

因此，AI 公司一直在努力开发能够直接输出任何数学问题正确解答的 LLM 系统。OpenAI 的这项成果，向这个方向迈出了重要一步。但它也符合此前 AI 辅助数学研究的一贯模式。

首先，其他公司也一直在尝试解决 Erdős 问题。由于 Erdős 在其职业生涯中提出了数百个问题——而数学家 Thomas Bloom 又组织了一项工作，将这些问题全部汇编到 www.erdosproblems.com——AI 公司一直把它们当作评估 AI 系统的测试场。1 月，剑桥大学本科生 Kevin Barreto 与一位朋友合作，要求 GPT-5.2 和 Harmonic 的 Aristotle 给出某个 Erdős 问题的首个自主解答。5 月 22 日，也就是 OpenAI 公布消息两天后，Google 宣布其 AI 系统已经解决了 9 个开放的 Erdős 问题，其中包括 2 个已经开放超过 50 年的问题。

需要明确的是，OpenAI 解决的这个问题比我刚才提到的其他任何工作都更令人印象深刻。但 OpenAI 的解法，与过去 AI 的努力相比，其实更接近后者，而不像标题看上去那么颠覆。

单位距离问题之所以在 80 年里都没有被解决，尽管它早已广为人知，原因之一是大多数人都认为 Erdős 的猜想是正确的。但我们现有的数学工具，离证明 Erdős 的上界还差得很远。因此，数学家们预期，任何对该猜想的证明都必须引入重大新思想或新方法。

然而，正如我们已经看到的那样，AI 通过对 Erdős 最初构造的一个扩展，反而否定了这个猜想。这是一个巧妙而不明显的解法，但它也在某种程度上类似于像 AlphaEvolve 这样的系统所做的优化工作。

这种动态也反映在一些数学家的回应中。数学家 Tim Gowers 写道，当他第一次听说这个 AI 的结果时，他以为它已经证明了这个定理。“我花了一个晚上的时间来调整自己对世界的看法：如果 AI 能想出这样的证明，那数学家的时代也许很快就要结束了。”

但第二天早上，Gowers 和其他外部审阅者收到了一封关于这一结果的邮件，他意识到，这个 LLM “是证伪了这个猜想，而不是证明它，这让我大大松了一口气。”

OpenAI 的解决方案还具备两个特性，这些特性体现了 AI 模型相对于人类的优势。

首先，最终的解法依赖于应用来自一个截然不同的数学领域——代数数论——的复杂技术。AI 系统已经在海量数学内容上接受训练，而数学世界里本来就有大量知识，因此它们对既有数学工作的了解比世界上任何人类都更广。对人类来说，要解决这个问题，就必须同时掌握相关的代数数论知识，还要对单位距离问题感兴趣；这种组合极为罕见。

其次，这个推理过程极其繁琐，而且看起来成功的可能性很低，以至于大多数人类都不会觉得值得一试。多伦多大学教授 Jacob Tsimerman 在 OpenAI 的文件中提到，他曾短暂考虑过采取类似的方法来证伪这个猜想。但这种技术“非常耗时，而且常常不会有结果”，所以他放弃了这个项目。

而 AI 则可以不断尝试许多最终行不通的证明策略，直到找到一个可行的。OpenAI 甚至可以多次运行这个问题，直到某个模型找到解决方案。事实上，OpenAI 的一张图表显示，即便给到最大的 token 预算，内部模型也只能有一半的概率解出这个问题。

需要说明的是，AI 系统所做的事情仍然令人印象深刻。Tsimerman 后来在他的评论中说：“总是很容易在看到一份完成的证明后，事后把它说成是显而易见的。” 但正如我前面提到的，这件事也确实发挥了 AI 系统的优势。

在短期到中期，这指向一个 AI 模型与人类相互补充、而非取代人类的世界。AI 系统将处理由人类数学家整理出来的一系列问题，或者帮助人类从看似无关的数学领域中找到相关思路。但它们不会立即取代人类在选择提出哪些问题、以及开发全新技术方面的角色。

即便是这一成果，也在很大程度上是人机协作的结果。虽然 AI 系统独自找到了证明，但人类数学家验证了这一结果。还有其他人类提出了写得更好的证明，并在 AI 的初步思路上加以扩展，例如上文提到的 Will Sawin 找到了一个显式下界。

不过，这种互补性还能持续多久，目前并不清楚。Gowers 在评论的其余部分探讨了这样一个问题：当听说 AI 已经证明该猜想是错误的时候，他感到如释重负，这种感觉是否正当。他基本上得出的结论是，这种感觉是正当的，但他在脚注中写道，他猜测“AI 很快就会在构建理论、提出定义以及提出有趣问题等其他活动中达到很高水平”。

在过去一年里，我们已经从那些还没在高中数学竞赛中胜出的 AI 系统，走到了如今能够以有趣方式推动数学发展的系统。看起来，AI 系统在处理数学问题时，继续变得更加自主是很可能的。

与此同时，我们对当前模型在数学方面究竟能做到什么，还没有完全探索清楚。OpenAI 公布这一消息后不久，密歇根大学博士后 Xiao Ma 发现，如果给 GPT-5.5 一个小提示，它也能够证明 Erdős 是错的。如果一个广泛可用的模型能够推翻这一著名猜想，而没有人注意到，那么今天还有多少其他发现，是没有人想到去尝试的？

Kai Williams 是 Understanding AI 的记者，这是一份由 Ars Technica 前员工 Timothy B. Lee 创办的 Substack 新闻通讯。他的工作得到了 Tarbell Fellowship 的支持。订阅 Understanding AI，可从 Tim 和 Kai 那里获得更多内容。

来源与参考

收录于 2026-06-02