OpenAI模型声称攻克埃尔德什难题

Ars Technica AI··作者 Ars Contributors

关键信息

蒂姆·高尔斯将这一解答称为AI数学中的一个里程碑,而丹尼尔·利特则表示,这是他第一次把一项由AI自主产生的结果本身就视为令人兴奋的成果。文章还指出,这个证明借用了多个数学分支中的既有思想,并没有提出根本性的新技术,之后还被人类数学家整理和扩展。

资讯摘要

OpenAI在5月中旬宣布,其内部模型已经推翻了埃尔德什单位距离猜想,这是离散几何中的一个长期难题。这个说法之所以重要,是因为该猜想大约80年来一直没有被解决,被视为典型的高难度数学问题。OpenAI随后让几位数学家提前查看了结果,并公开了他们的反馈。菲尔兹奖得主蒂姆·高尔斯表示,单位距离问题的解法无疑是AI数学中的一个里程碑。

多伦多大学教授丹尼尔·利特则说,这是他第一次把一项由AI自主产生的结果本身就看作令人兴奋的成果,而不只是未来进步的前兆。文章认为,这很可能是AI系统第一次找到能够解决重大公开猜想的证明,但它并没有把这看作与过去AI数学进展完全断裂的事件。三年前,大语言模型还难以处理算术题,而直到去年它们才开始在高中数学竞赛中表现出色。作者将这项新成果描述为这一演进过程中的下一步:模型综合了数学多个分支的既有思想构建出完整证明,而人类数学家随后又对其进行了整理和扩展。

OpenAI模型声称攻克埃尔德什难题

资讯正文

5月中旬,OpenAI宣布,一款内部AI模型已经推翻了厄尔德什单位距离猜想,这是离散几何领域一个著名的问题,在过去80年里一直困扰着人类数学家。

OpenAI向几位数学家提前披露了这一结果,并公布了他们的反应。曾获得数学界最负盛名的菲尔兹奖的Tim Gowers写道:“毫无疑问,单位距离问题的解答是AI数学中的一个里程碑。”

多伦多大学教授Daniel Litt写道:“这是我第一次看到一个由AI自主产生的结果,它本身就让我感到兴奋,而不只是因为它是一个领先指标。”

可以说,这是AI系统第一次找到一个证明,解决了一个重大的公开猜想。这很了不起,但我并不认为这与AI在数学领域此前的发展轨迹有着根本性的断裂。

三年前,大语言模型(LLM)还很难解决算术题。直到去年,LLM才开始在高中数学竞赛中屡屡拿高分。

今年1月,当我参加全球最大的年度数学会议——联合数学会议(Joint Mathematics Meetings)时,我了解到AI系统已经开始为数学研究作出贡献,但只是在受限的场景下。要把AI输出转化为可发表的定理,仍需要大量的人类解读。

OpenAI这项新成果是这一进程中的下一步。该AI模型巧妙地运用了来自数学多个子领域的既有思想,构造出了一份完整证明。但它并没有首创任何真正新的技术。此后,这一结果已被人类数学家整理并扩展。

这指向了一个中期未来:人类数学家与AI模型将彼此互补。AI对既往工作的了解比任何在世的人都更广,而且也更愿意去反复尝试那些费时费力、但很可能行不通的证明策略。不过,人类仍然能够对任何一个问题进行更深入的思考,并提出更有意思的问题。

但这种局面未必会持续太久。AI系统在数学上的进步速度如此之快,以至于十年后人类数学家究竟还会扮演什么角色,甚至是否仍有角色,都还不清楚。

单位距离问题

保罗·厄尔德什(Paul Erdős)是历史上最富产的数学家之一。他一生发表了1500多篇论文,这是有史以来最多的。他最杰出的才能之一,就是提出那些表述简单、却有深厚根基的问题。

1946年,他提出了单位距离问题。设想你在二维平面上有一些点,并测量每一对点之间的距离:

Credit:

Kai Williams / Understanding AI Credit:

Kai Williams / Understanding AI

在这张图中,有五个点和十对点。其中三对点的距离恰好为1个单位:AD、BE和CE。

我们能否重新排列这些点,让更多的点对之间恰好相距1个单位?

可以。比如,我们可以把A点和D点移动得更靠近B、C和E的点簇。再多做一些工作,我们还可以进一步重新排列这些点,使得有七对点的距离恰好为1个单位。但这已经是我们能做到的极限了。

我们也可以用 6 个点、7 个点,依此类推来做同样的分析。但随着点数增加,问题很快就会变得过于复杂,无法求出精确答案。

因此,Erdős 并没有去问在给定点数下究竟能有多少个单位距离,而是试图在 n 个点的情况下计算长度为 1 的线段数量的上界和下界,假设 n 是一个很大的数。

为了帮助计算下界,Erdős 假设这些点会按网格排列。这大概不是最优布局,但如果他能够证明网格中的点有一定数量的单位距离点对,那么最优排列至少也必须有这么多。

最简单的做法,是把网格间距设成这样:每个点与其正上方、正下方、左边和右边的邻点距离都是 1。不过,Erdős 发现,如果把对角线也考虑进去,效果会更好。若把网格间距缩小,就能让每个点与更多邻点的距离变成 1。在上面的示意图中,如果网格间距为 1,那么每个点都与 4 个邻点相距 1(左图)。而如果网格间距为 ⅕(如右图所示),那么每个点都与 12 个邻点相距 1:

OpenAI 对其新结果的说明中附带了一张令人困惑的图,图里是网格中的点,以及连接它们的一堆线。如果像这样叠加一个圆,图就更容易理解了:

之所以有效,是因为勾股定理:如果一个点在另一个点的右边 a 个单位、上方 b 个单位,那么这两个点之间的距离 c 满足 a² + b² = c²。诀窍在于选取某个 c²,使得存在很多组整数 a 和 b 满足 a² + b² = c²。然后,如果把网格按比例缩小到每个点与邻点的距离为 1/c,就会出现很多个单位距离。

例如,如果我们选择 c² = 25,那么勾股方程可以由 0² + 5² = 25 或 3² + 4² = 25 来满足。这对应于我前面展示的 12 个网格点圆,点的位置包括 (0,5)、(3,4)、(4,3)、(5,0)、(-4,3)、(-3,4) 等等。(严格来说,这些长度都应该除以 5——例如 (⅗, ⅘)——但为了清楚起见,我这里省略了分母。)

OpenAI 的图示基于选择 c² = 65,它可以由 1² + 8² = 65 或 4² + 7² = 65 来满足。这意味着,如果网格间距是 1/√65,那么每个点都将与另外 16 个点相距 1:(1,8)、(4,7)、(7,4)、(8,1)、(-1,8)、(-4,7) 等等。若能谨慎选择更大的 c² 值,就能得到更多的整数对角线,从而产生更多的单位距离点对。

不过,如果 c² 相对于网格中的点数来说太大,那么许多可能相距 1 的邻点就会落到网格之外。

简而言之,我们希望选择一个足够大、但又不要太大的 c²。借助数论中的一些见解,包括 Jacobi 的两平方定理,Erdős 证明了,一个大小最合适的圆可以让单位距离点对的数量增长得比点数更快,但也只是勉强快一点。

问题变成了“你能做得更好吗?”为了寻找一个上界,埃尔德什(Erdős)借用了数学中一个截然不同的领域——图论——中的论证,证明单位距离的数量不可能无限增加,只能有那么多。但他的上界增长得要比他能够构造出的最佳下界快得多,快很多很多。

埃尔德什的猜想是,真实的最优值会比下界更接近下界,而不是接近上界。他预测,但无法证明,单位距离对的最大数量增长得只会比点的数量略快一点。

更准确地说,埃尔德什猜想单位距离的数量会是 n^(1+o(1))。换句话说,对于足够大的 n,单位距离的最大数量会小于任意 𝜖 > 0 时的 n^(1+𝜖)。这最终可能会比他构造的下界——即 n^(1 + C/(log log n)),其中 C 是某个常数——增长得稍快一些,但仍然处在同一个大致范围内。

证明他的猜想后来被称为单位距离问题。在接下来的 80 年里,看起来埃尔德什是对的。

然后,一个 OpenAI 模型证明他错了。

AI 的方法

埃尔德什的猜想假定,至少对于大量点而言,正方形网格所能产生的单位距离对数量,大致可以与用其他方式组织这些点得到的数量相当。OpenAI 的 AI 通过证明存在另一种更复杂的组织 n 个点的方式,可以让更多点对之间的距离恰好为一个单位,从而推翻了这一假设。

正因为这种新的点阵模式更复杂,要简洁地解释它并不容易。但你可以把它理解为对埃尔德什网格的一种巧妙改造。

这个 AI 先在高维空间中构造了一个网格,然后把这个更复杂的结构投影到二维。并且,它没有使用像 (1,3) 或 (-3,6) 这样的整数坐标网格,而是使用了所谓的代数整数来构建这种更复杂的网格。事实证明,这类高维网格具有更丰富的结构,因此 AI 能在相同数量的点中塞入更多单位距离。

要把这种替代性的点排列方式画出来并不容易,因为它只有在点数非常大的时候才会体现出优势。不过,这里有一种以类似方式构造出的更简单的点排列。你可以点击这里,亲自操作一下这个示意图。

它有 1,345 个点,只产生 5,916 条单位距离,少于使用埃尔德什方法构造的 1,296 点正方形网格所产生的 7,632 条单位距离。但我认为,它有助于说明:一种并非网格的模式,也可能比正方形网格产生更多单位距离。

更复杂的模式确实有回报。虽然 OpenAI 模型的证明并没有明确说明对于 n 个点可以有多少个单位距离对,但人类数学家 Will Sawin 已经能够证明,它至少以 n 1.014 的速度增长。这个数字看起来也许不大,但当 n 变得真正巨大时,它会比埃尔德什方法得到的计数大得多。

话虽如此,AI 的结果并没有彻底解决这个问题。我们目前对单位距离数量的最佳上界大约是 n 1.333 。还需要更多工作来缩小这个差距。

这个结果在数学领域的 AI 进展中处于什么位置?

如果你在两周前——也就是 OpenAI 公布消息之前——问我,LLM 对数学最具创新性的贡献是什么,我大概会提到 Google DeepMind 的 AlphaEvolve 系统。

AlphaEvolve 利用 LLM 作为优化过程的引擎。如果你能把一个数学问题转化为一段可供优化的代码——而这类情况其实并不少见——那么 LLM 也许就能在某些类型的问题上找到比人类更好的解法。11 月,四位数学家(包括 Terence Tao)发表了一篇论文,分析了 AlphaEvolve 在数学文献中 67 个优化问题上的表现。他们发现,在某些情况下,AlphaEvolve 能够改进既有文献中的结果。

这比以往 LLM 的贡献——比如文献综述——在自主性上更进一步,但它仍然需要人类先把问题框定为优化问题,再把 AI 的输出转化为可用的数学成果。而且,只有某些类型的问题适合这种方法。那些不包含可优化数值的、更偏概念性的问题,无法轻易用 AlphaEvolve 来研究。

因此,AI 公司一直在努力开发能够直接输出任何数学问题正确解答的 LLM 系统。OpenAI 的这项成果,向这个方向迈出了重要一步。但它也符合此前 AI 辅助数学研究的一贯模式。

首先,其他公司也一直在尝试解决 Erdős 问题。由于 Erdős 在其职业生涯中提出了数百个问题——而数学家 Thomas Bloom 又组织了一项工作,将这些问题全部汇编到 www.erdosproblems.com——AI 公司一直把它们当作评估 AI 系统的测试场。1 月,剑桥大学本科生 Kevin Barreto 与一位朋友合作,要求 GPT-5.2 和 Harmonic 的 Aristotle 给出某个 Erdős 问题的首个自主解答。5 月 22 日,也就是 OpenAI 公布消息两天后,Google 宣布其 AI 系统已经解决了 9 个开放的 Erdős 问题,其中包括 2 个已经开放超过 50 年的问题。

需要明确的是,OpenAI 解决的这个问题比我刚才提到的其他任何工作都更令人印象深刻。但 OpenAI 的解法,与过去 AI 的努力相比,其实更接近后者,而不像标题看上去那么颠覆。

单位距离问题之所以在 80 年里都没有被解决,尽管它早已广为人知,原因之一是大多数人都认为 Erdős 的猜想是正确的。但我们现有的数学工具,离证明 Erdős 的上界还差得很远。因此,数学家们预期,任何对该猜想的证明都必须引入重大新思想或新方法。

然而,正如我们已经看到的那样,AI 通过对 Erdős 最初构造的一个扩展,反而否定了这个猜想。这是一个巧妙而不明显的解法,但它也在某种程度上类似于像 AlphaEvolve 这样的系统所做的优化工作。

这种动态也反映在一些数学家的回应中。数学家 Tim Gowers 写道,当他第一次听说这个 AI 的结果时,他以为它已经证明了这个定理。“我花了一个晚上的时间来调整自己对世界的看法:如果 AI 能想出这样的证明,那数学家的时代也许很快就要结束了。”

但第二天早上,Gowers 和其他外部审阅者收到了一封关于这一结果的邮件,他意识到,这个 LLM “是证伪了这个猜想,而不是证明它,这让我大大松了一口气。”

OpenAI 的解决方案还具备两个特性,这些特性体现了 AI 模型相对于人类的优势。

首先,最终的解法依赖于应用来自一个截然不同的数学领域——代数数论——的复杂技术。AI 系统已经在海量数学内容上接受训练,而数学世界里本来就有大量知识,因此它们对既有数学工作的了解比世界上任何人类都更广。对人类来说,要解决这个问题,就必须同时掌握相关的代数数论知识,还要对单位距离问题感兴趣;这种组合极为罕见。

其次,这个推理过程极其繁琐,而且看起来成功的可能性很低,以至于大多数人类都不会觉得值得一试。多伦多大学教授 Jacob Tsimerman 在 OpenAI 的文件中提到,他曾短暂考虑过采取类似的方法来证伪这个猜想。但这种技术“非常耗时,而且常常不会有结果”,所以他放弃了这个项目。

而 AI 则可以不断尝试许多最终行不通的证明策略,直到找到一个可行的。OpenAI 甚至可以多次运行这个问题,直到某个模型找到解决方案。事实上,OpenAI 的一张图表显示,即便给到最大的 token 预算,内部模型也只能有一半的概率解出这个问题。

需要说明的是,AI 系统所做的事情仍然令人印象深刻。Tsimerman 后来在他的评论中说:“总是很容易在看到一份完成的证明后,事后把它说成是显而易见的。” 但正如我前面提到的,这件事也确实发挥了 AI 系统的优势。

在短期到中期,这指向一个 AI 模型与人类相互补充、而非取代人类的世界。AI 系统将处理由人类数学家整理出来的一系列问题,或者帮助人类从看似无关的数学领域中找到相关思路。但它们不会立即取代人类在选择提出哪些问题、以及开发全新技术方面的角色。

即便是这一成果,也在很大程度上是人机协作的结果。虽然 AI 系统独自找到了证明,但人类数学家验证了这一结果。还有其他人类提出了写得更好的证明,并在 AI 的初步思路上加以扩展,例如上文提到的 Will Sawin 找到了一个显式下界。

不过,这种互补性还能持续多久,目前并不清楚。Gowers 在评论的其余部分探讨了这样一个问题:当听说 AI 已经证明该猜想是错误的时候,他感到如释重负,这种感觉是否正当。他基本上得出的结论是,这种感觉是正当的,但他在脚注中写道,他猜测“AI 很快就会在构建理论、提出定义以及提出有趣问题等其他活动中达到很高水平”。

在过去一年里,我们已经从那些还没在高中数学竞赛中胜出的 AI 系统,走到了如今能够以有趣方式推动数学发展的系统。看起来,AI 系统在处理数学问题时,继续变得更加自主是很可能的。

与此同时,我们对当前模型在数学方面究竟能做到什么,还没有完全探索清楚。OpenAI 公布这一消息后不久,密歇根大学博士后 Xiao Ma 发现,如果给 GPT-5.5 一个小提示,它也能够证明 Erdős 是错的。如果一个广泛可用的模型能够推翻这一著名猜想,而没有人注意到,那么今天还有多少其他发现,是没有人想到去尝试的?

Kai Williams 是 Understanding AI 的记者,这是一份由 Ars Technica 前员工 Timothy B. Lee 创办的 Substack 新闻通讯。他的工作得到了 Tarbell Fellowship 的支持。订阅 Understanding AI,可从 Tim 和 Kai 那里获得更多内容。

来源与参考

  1. 原始链接
  2. An OpenAI model solved a famous math problem that stumped humans for 80 years

收录于 2026-06-02