OpenAI模型推翻埃尔多什单位距离猜想

The Decoder·5月22日 00:11 UTC·作者 Maximilian Schreiner

关键信息

这项突破并不是只靠经典几何完成的；模型使用了代数数论中的工具，尤其是带有丰富对称性的复数体系。文章指出，这一提升在绝对数值上并不大——每当点数翻倍时，单位距离点对大约多出 1%——但在数学上意义重大，因为埃尔多什的猜想几乎断言不可能出现这种改进。

资讯摘要

OpenAI 表示，其一个内部推理模型找到了单位距离猜想的反例。这个猜想由保罗·埃尔多什于 1946 年提出，问题是：平面上放置若干点时，能有多少点对之间的距离恰好为 1。埃尔多什认为，一个略微倾斜的方格排列已经接近最优。九位外部数学家随后验证了这一结果，压缩了证明，并写出了配套分析论文。文章指出，这个问题长期以来被视为组合几何中最著名、也最容易表述的问题之一。文中还提到，埃尔多什当年甚至为其反例提供过 500 美元悬赏。

新的构造确实比经典方格排列产生了更多单位距离点对，Will Sawin 估计其优势大约是每当点数翻倍时多出 1% 左右。尽管如此，这个问题并没有完全终结，因为 1984 年就已知的一个理论上界仍然高于这项新构造。最令人意外的是方法本身：模型并没有直接依赖几何，而是使用了代数数论中的工具。Thomas Bloom 认为，人类若想找到同样的思路，需要极强的耐心、敢于挑战埃尔多什观点的决心、对数域的熟悉，以及对较为专门的类域论的掌握。Sawin 还补充说，常见的“在旧方格基础上无限放大”思路最终仍会回到埃尔多什的界，而模型的关键技巧是保持每个数体系中的尺度不变，同时逐步切换到更丰富的数体系。

资讯正文

OpenAI 通过一项“AI 数学里程碑”将自动推理的边界向前推进，专家们正在对其进行解读

要点

- OpenAI 的一个内部推理模型推翻了匈牙利数学家保罗·埃尔德什（Paul Erdős）于 1946 年提出的单位距离猜想。该模型找出了一种新的点阵排列，使得单位距离点对的数量超过了经典的正方形网格——而埃尔德什曾认为这几乎是不可能的。

- 这套 AI 并未采用几何方法，而是借助了代数数论中的复数体系。参与研究的研究人员表示，这个系统之所以成功，是因为它把海量技术知识与耐心结合起来，沿着人类通常会认定“不值得探索”的路径不断推进。

- 9 位外部数学家验证了这份证明，对其进行了缩短，并在一篇配套论文中发表了分析。专家称，这一结果是 AI 在数学领域的一个里程碑，但也强调，人类研究者仍然需要去理解、提供语境，并在机器生成的证明基础上继续推进。

OpenAI 的一个内部推理模型已经推翻了匈牙利数学家保罗·埃尔德什提出的所谓单位距离猜想。OpenAI 在公布这一结果的同时，还发布了一篇由 9 位外部数学家撰写的配套论文；这些数学家对证明进行了验证、缩短并加以评注。

这个问题本身看似很简单：在一张纸上放置一定数量的点。能有多少对点之间的距离恰好为一个单位？1946 年，埃尔德什猜想，一个略微倾斜的正方形网格上的简单排列，已经接近最优。这样的排列所产生的点对数量，仅仅比点的数量本身增长得稍快一点点。根据数学家 Thomas Bloom 的说法，埃尔德什曾悬赏 500 美元征求一个反例。按照离散几何标准参考书《Research Problems in Discrete Geometry》的说法，这个问题被认为是“也许是组合几何中最广为人知（且最容易解释）的难题”。

八十年后的更优构造

OpenAI 的模型找出了一种新的点阵排列，所产生的单位距离点对明显多于经典的正方形网格。普林斯顿大学的 Will Sawin 估计，这一提升大约是在点数每翻一倍时，多出 1% 左右的点对。听起来似乎不大。但放在上下文中看，这意义重大，因为埃尔德什的猜想几乎等于说，这种提升根本不可能出现。尽管如此，这个问题并没有被完全解决：自 1984 年以来已知的一个理论上界，仍然明显高于新构造所达到的水平。

令人惊讶的是，这些工具来自哪里：不是几何，而是代数数论。模型没有沿用经典的点网格，而是使用了复数体系，其内部对称性可以转化为特别稠密的点模式。这些工具在数论中已经标准化使用了几十年。然而，在参与研究的数学家看来，把它们应用到平面几何中的一个基础问题上，原本几乎是天方夜谭。

为什么人类会错过这个解法

Thomas Bloom 在他为配套论文所写的贡献中指出，要让一个人类找到这个解法，必须有四个条件同时满足：你得在这个问题上投入大量时间，敢于反对 Erdős 已有的看法并 वास्तव地尝试去推翻它，想把原始构造转化到数域的世界里，并且对相当专门的类域论足够熟悉。Bloom 写道：“这个 AI 满足了所有这些标准。”它结合了“超人的耐心，以及对大量技术工具的熟悉”。

Sawin 还补充了一个技术性原因，解释为什么显而易见的推广会失败。自然的做法本来是选取一个扩展数系，并在其中不断查看越来越大的片段，本质上就是在一个更复杂的数的世界里，把旧的网格放大。Sawin 表示，这样做只会又回到原来的 Erdős 界。模型的关键技巧恰恰相反：它在每个数系内部保持尺度不变，但在每一步都切换到更丰富的数系。为什么这种特定的切换有效，对任何人类来说都并不明显，Sawin 写道。

就在 AI 给出解法前一个月，Bloom 还在一篇博客文章中把这个问题列为他的“Erdős 十大问题”之一。促成这一做法的动机是：一些观察者在看到此前 AI 对更简单的 Erdős 问题给出解答后，便得出结论，认为这位数学家的所有问题都很平凡。Bloom 希望表明，许多 Erdős 问题背后已经孕育了数十年的深刻方法。

单位距离猜想是他名单上唯一的离散几何问题，恰恰因为它“几十年来一直未被证明”。Bloom 指出，Spencer、Szemerédi 和 Trotter 在 1984 年建立的上界，在 40 多年里都没有得到改进：“这个问题很好地说明，尽管近些年离散几何领域取得了一些惊人的成果，我们距离理解哪怕其中一些最基本的问题，仍然相去甚远。”他没想到 AI 会在仅仅一个月后就攻克这个特定问题：“虽然我相信 AI 终究会在那份名单上的至少几个问题上取得一些进展，但我没想到这会在仅仅一个月后就发生！”

数学界的反应

作为顶尖组合数学家之一，Noga Alon 将这一结果称为“一项杰出的成就”，并把这一令人惊讶的发现描述为：“这一构造及其分析，以优雅而巧妙的方式应用了代数数论中相当复杂的工具。”菲尔兹奖得主 Tim Gowers 写道，如果一位人类把这篇论文投给《Annals of Mathematics》并请他快速评估，“我会毫不犹豫地建议录用。”此前没有任何 AI 生成的证明能接近这一水平。Gowers 称这是一座“AI 数学中的里程碑”。

数论学家 Arul Shankar 认为，这项工作证明了当前的 AI 模型“已经不只是人类数学家的助手——它们有能力提出原创且巧妙的想法，并将其付诸实现”。Bloom 对此作了限定：这份证明并没有带来任何根本性的新几何工具，而这类工具很可能才是该猜想完整证明所需要的。但它表明，“关于这些问题，数论构造能说的远比我们先前以为的要多得多。”他预计，“未来几个月里，会有许多代数数论学家仔细研究离散几何中的其他开放问题。”

为什么这个案例不同

近几个月来，AI 系统已经解决了或部分解决了一长串 Erdős 问题。由 Bloom 维护的平台 erdosproblems.com 收录了大约 1,000 个问题。根据菲尔兹奖得主 Terence Tao 的说法，到 2025 年 9 月，其中约有 380 个已经被解决。在 2026 年初一段混乱的时期里，又有大约 50 个问题被攻克，其中一些是由人类完成的，一些由 AI 完成，还有一些是人机合作完成的。那些解答中有好几项只需写在几页纸上，或者难度仅相当于有挑战性的家庭作业。

这正是促使 Bloom 编写他的前 10 名榜单的原因。他注意到，他“遗憾地看到，一些数学家最近开始对 Erdős 问题不屑一顾，也许是因为他们看到网站上有报道称 AI 解决了一些后来被证明相当简单的问题，并错误地由此推断，Erdős 提出的所有问题都只是有趣的新奇题目，最多也就是奥赛题的水平。”

单位距离问题的反证在随附论文以及 OpenAI 的表述中，都被明确放在了不同的类别中。按照 OpenAI 的说法，这是“第一次，一个数学子领域中的重要开放问题被 AI 自主解决”。Bloom 这样描述自己的反应：当他得知这是一个反证时，他的最初惊讶“稍稍减弱了”，而当他看到这个构造时，这种惊讶又进一步减弱。

不过，这一发现仍然站得住脚：与此前那些 Erdős 问题的解法不同，这并不是一道容易上手的练习题。它是一个被认为棘手了 80 年的问题，其上界自 1984 年以来一直没有改变，而它的解答需要借助来自遥远领域的工具。

Gowers 将其概括如下：如果是人类提交了这份工作，他会“毫不犹豫”地把它接收进《Annals of Mathematics》。此前任何由 AI 生成的证明都远未达到这种程度。

这一结果对数学本身说明了什么

参与该研究的几位数学家在随附论文中，借此反思 AI 对他们所在领域所带来的结构性后果。合著者 Daniel Litt 提出了令人不安的问题：为什么会存在一些著名问题，只需一个相对简短而巧妙的论证就能解决？他的猜测是：要么研究者一直坚持着次优假设——比如 Erdős 本人认为自己的猜想是正确的——要么就说明，这些解决方案需要依赖相关领域大多数人并不熟悉的方向中的想法。

“如果这些解释是正确的，我们应该感到有些不安，”Litt写道。“它们表明，朝着专业化和分隔化发展的激励，尽管可以理解，却让我们失去了一些高质量的科学。”Litt将人类的做法——研究者出于个人好奇深入钻研少数几个问题——与当前AI模式进行对比：后者是系统性地把整个问题清单逐一处理。这相当于“对数学问题的关注范围进行了大幅扩张”。

Gowers对自己的反应也直言不讳。起初他以为AI证明了这个猜想而不是否定了它，于是他花了一整个晚上“调整我的世界观：如果AI都能给出那样的证明，那么数学家们也许很快就要完了”。第二天早上，当错误被澄清后，他感到“非常松了一口气”。一个反例可以被想象为耐心和反复试错的结果；而真正的证明则需要“深刻洞见”，那会令人不安。

在配套论文中，Gowers提出了自己衡量证明难度的方法。他称之为“相对于专家的Kolmogorov复杂度”——也就是一位专家要独立重建该证明所需的最短提示序列长度。他初步的看法是：AI目前整体上并不比人类更强，但在某些问题类型上具有优势。它拥有“百科全书式的数学知识”，对时间管理也不那么担忧，因此“有能力相当努力地去证明那些看起来不太可能是真的命题”。

尽管如此，他表示，进展不会停滞。很快就会出现一些AI方案，“即使事后回看，我们也会很难把它们解释成只是比预期更容易”。即便AI还不能找到冗长而复杂的证明，“我们也很可能已经进入一个时代，在这个时代里，人类将很难在数学问题求解上与AI竞争。”

Bloom则采取了中间立场。面对他自己的测试问题——这个证明是否让领域学到了关于该问题的新东西——他的回答是一个“有所保留的肯定”。看起来，数论构造对于这类问题的说明力比任何人此前怀疑的都要强，而所需的数论也可能非常深奥。领域内一些人可能会失望，因为这项证明并没有带来“强有力的新几何工具”或意料之外的结构性结果，而这些大概才是猜想被完全证明时所需要的东西。这个解法，“事后看来”，是一个自然的推广，但“高度非平凡”。人类要找到它，得同时碰上四个罕见的巧合。

Bloom这样描述AI的优势：它把“超人的耐心水平”与“对大量技术工具的熟悉”结合在一起，并且固执地追寻“人类可能已经认为不值得花时间去探索的路径”。他的判断是：“知识的前沿本来就很崎岖，毫无疑问，在接下来的数月和数年里，我们会在数学的许多其他领域看到类似的成功，长期未解的开放问题将被AI通过揭示意想不到的联系并把现有技术工具推到极限而解决。”

人类与机器分工合作

OpenAI 发表的配套论文本身，也预示着未来 AI 与研究人员之间可能如何分工。根据 Bloom 的说法，模型生成的原始证明“完全有效”，但人类作者对其进行了“显著改进”。只有 Sawin 的精炼版本，才给出了可量化的改进幅度。发表于配套论文中的版本，比原始版本更短，也更具普适性。

这第二步最近成为 Tao 在斯坦福大学“数学的未来”研讨会上的演讲重点。Tao 认为，数学实践目前正经历一种“证明消化不良”：AI 系统生成并验证证明的速度越来越快，但人类的消化过程，也就是理解、解释、联系上下文并在成果基础上继续推进，已经跟不上了。他衡量一个解决方案是否真正完整的标准是：是否有人能够就此做一场报告并回答问题？在单位距离反例的案例中，9 位知名数学家同意正是去完成这项工作。这样的标准能否规模化，则完全是另一回事。

没有炒作的 AI 新闻——由人类精选

订阅 THE DECODER，享受无广告阅读、每周一次的 AI 新闻简报、我们独家的“AI Radar”前沿报告（每年 6 次）、完整档案访问权限，以及评论区访问权限。

来源与参考

收录于 2026-05-22