OpenAI模型推翻埃尔多什单位距离猜想
The Decoder··作者 Maximilian Schreiner
关键信息
这项突破并不是只靠经典几何完成的;模型使用了代数数论中的工具,尤其是带有丰富对称性的复数体系。文章指出,这一提升在绝对数值上并不大——每当点数翻倍时,单位距离点对大约多出 1%——但在数学上意义重大,因为埃尔多什的猜想几乎断言不可能出现这种改进。
资讯摘要
OpenAI 表示,其一个内部推理模型找到了单位距离猜想的反例。这个猜想由保罗·埃尔多什于 1946 年提出,问题是:平面上放置若干点时,能有多少点对之间的距离恰好为 1。埃尔多什认为,一个略微倾斜的方格排列已经接近最优。九位外部数学家随后验证了这一结果,压缩了证明,并写出了配套分析论文。文章指出,这个问题长期以来被视为组合几何中最著名、也最容易表述的问题之一。文中还提到,埃尔多什当年甚至为其反例提供过 500 美元悬赏。
新的构造确实比经典方格排列产生了更多单位距离点对,Will Sawin 估计其优势大约是每当点数翻倍时多出 1% 左右。尽管如此,这个问题并没有完全终结,因为 1984 年就已知的一个理论上界仍然高于这项新构造。最令人意外的是方法本身:模型并没有直接依赖几何,而是使用了代数数论中的工具。Thomas Bloom 认为,人类若想找到同样的思路,需要极强的耐心、敢于挑战埃尔多什观点的决心、对数域的熟悉,以及对较为专门的类域论的掌握。Sawin 还补充说,常见的“在旧方格基础上无限放大”思路最终仍会回到埃尔多什的界,而模型的关键技巧是保持每个数体系中的尺度不变,同时逐步切换到更丰富的数体系。

资讯正文
OpenAI 通过一项“AI 数学里程碑”将自动推理的边界向前推进,专家们正在对其进行解读
要点
- OpenAI 的一个内部推理模型推翻了匈牙利数学家保罗·埃尔德什(Paul Erdős)于 1946 年提出的单位距离猜想。该模型找出了一种新的点阵排列,使得单位距离点对的数量超过了经典的正方形网格——而埃尔德什曾认为这几乎是不可能的。
- 这套 AI 并未采用几何方法,而是借助了代数数论中的复数体系。参与研究的研究人员表示,这个系统之所以成功,是因为它把海量技术知识与耐心结合起来,沿着人类通常会认定“不值得探索”的路径不断推进。
- 9 位外部数学家验证了这份证明,对其进行了缩短,并在一篇配套论文中发表了分析。专家称,这一结果是 AI 在数学领域的一个里程碑,但也强调,人类研究者仍然需要去理解、提供语境,并在机器生成的证明基础上继续推进。
OpenAI 的一个内部推理模型已经推翻了匈牙利数学家保罗·埃尔德什提出的所谓单位距离猜想。OpenAI 在公布这一结果的同时,还发布了一篇由 9 位外部数学家撰写的配套论文;这些数学家对证明进行了验证、缩短并加以评注。
这个问题本身看似很简单:在一张纸上放置一定数量的点。能有多少对点之间的距离恰好为一个单位?1946 年,埃尔德什猜想,一个略微倾斜的正方形网格上的简单排列,已经接近最优。这样的排列所产生的点对数量,仅仅比点的数量本身增长得稍快一点点。根据数学家 Thomas Bloom 的说法,埃尔德什曾悬赏 500 美元征求一个反例。按照离散几何标准参考书《Research Problems in Discrete Geometry》的说法,这个问题被认为是“也许是组合几何中最广为人知(且最容易解释)的难题”。
八十年后的更优构造
OpenAI 的模型找出了一种新的点阵排列,所产生的单位距离点对明显多于经典的正方形网格。普林斯顿大学的 Will Sawin 估计,这一提升大约是在点数每翻一倍时,多出 1% 左右的点对。听起来似乎不大。但放在上下文中看,这意义重大,因为埃尔德什的猜想几乎等于说,这种提升根本不可能出现。尽管如此,这个问题并没有被完全解决:自 1984 年以来已知的一个理论上界,仍然明显高于新构造所达到的水平。
令人惊讶的是,这些工具来自哪里:不是几何,而是代数数论。模型没有沿用经典的点网格,而是使用了复数体系,其内部对称性可以转化为特别稠密的点模式。这些工具在数论中已经标准化使用了几十年。然而,在参与研究的数学家看来,把它们应用到平面几何中的一个基础问题上,原本几乎是天方夜谭。
为什么人类会错过这个解法
Thomas Bloom 在他为配套论文所写的贡献中指出,要让一个人类找到这个解法,必须有四个条件同时满足:你得在这个问题上投入大量时间,敢于反对 Erdős 已有的看法并 वास्तव地尝试去推翻它,想把原始构造转化到数域的世界里,并且对相当专门的类域论足够熟悉。Bloom 写道:“这个 AI 满足了所有这些标准。”它结合了“超人的耐心,以及对大量技术工具的熟悉”。
Sawin 还补充了一个技术性原因,解释为什么显而易见的推广会失败。自然的做法本来是选取一个扩展数系,并在其中不断查看越来越大的片段,本质上就是在一个更复杂的数的世界里,把旧的网格放大。Sawin 表示,这样做只会又回到原来的 Erdős 界。模型的关键技巧恰恰相反:它在每个数系内部保持尺度不变,但在每一步都切换到更丰富的数系。为什么这种特定的切换有效,对任何人类来说都并不明显,Sawin 写道。
就在 AI 给出解法前一个月,Bloom 还在一篇博客文章中把这个问题列为他的“Erdős 十大问题”之一。促成这一做法的动机是:一些观察者在看到此前 AI 对更简单的 Erdős 问题给出解答后,便得出结论,认为这位数学家的所有问题都很平凡。Bloom 希望表明,许多 Erdős 问题背后已经孕育了数十年的深刻方法。
单位距离猜想是他名单上唯一的离散几何问题,恰恰因为它“几十年来一直未被证明”。Bloom 指出,Spencer、Szemerédi 和 Trotter 在 1984 年建立的上界,在 40 多年里都没有得到改进:“这个问题很好地说明,尽管近些年离散几何领域取得了一些惊人的成果,我们距离理解哪怕其中一些最基本的问题,仍然相去甚远。”他没想到 AI 会在仅仅一个月后就攻克这个特定问题:“虽然我相信 AI 终究会在那份名单上的至少几个问题上取得一些进展,但我没想到这会在仅仅一个月后就发生!”
数学界的反应
作为顶尖组合数学家之一,Noga Alon 将这一结果称为“一项杰出的成就”,并把这一令人惊讶的发现描述为:“这一构造及其分析,以优雅而巧妙的方式应用了代数数论中相当复杂的工具。”菲尔兹奖得主 Tim Gowers 写道,如果一位人类把这篇论文投给《Annals of Mathematics》并请他快速评估,“我会毫不犹豫地建议录用。”此前没有任何 AI 生成的证明能接近这一水平。Gowers 称这是一座“AI 数学中的里程碑”。
数论学家 Arul Shankar 认为,这项工作证明了当前的 AI 模型“已经不只是人类数学家的助手——它们有能力提出原创且巧妙的想法,并将其付诸实现”。Bloom 对此作了限定:这份证明并没有带来任何根本性的新几何工具,而这类工具很可能才是该猜想完整证明所需要的。但它表明,“关于这些问题,数论构造能说的远比我们先前以为的要多得多。”他预计,“未来几个月里,会有许多代数数论学家仔细研究离散几何中的其他开放问题。”
为什么这个案例不同
近几个月来,AI 系统已经解决了或部分解决了一长串 Erdős 问题。由 Bloom 维护的平台 erdosproblems.com 收录了大约 1,000 个问题。根据菲尔兹奖得主 Terence Tao 的说法,到 2025 年 9 月,其中约有 380 个已经被解决。在 2026 年初一段混乱的时期里,又有大约 50 个问题被攻克,其中一些是由人类完成的,一些由 AI 完成,还有一些是人机合作完成的。那些解答中有好几项只需写在几页纸上,或者难度仅相当于有挑战性的家庭作业。
这正是促使 Bloom 编写他的前 10 名榜单的原因。他注意到,他“遗憾地看到,一些数学家最近开始对 Erdős 问题不屑一顾,也许是因为他们看到网站上有报道称 AI 解决了一些后来被证明相当简单的问题,并错误地由此推断,Erdős 提出的所有问题都只是有趣的新奇题目,最多也就是奥赛题的水平。”
单位距离问题的反证在随附论文以及 OpenAI 的表述中,都被明确放在了不同的类别中。按照 OpenAI 的说法,这是“第一次,一个数学子领域中的重要开放问题被 AI 自主解决”。Bloom 这样描述自己的反应:当他得知这是一个反证时,他的最初惊讶“稍稍减弱了”,而当他看到这个构造时,这种惊讶又进一步减弱。
不过,这一发现仍然站得住脚:与此前那些 Erdős 问题的解法不同,这并不是一道容易上手的练习题。它是一个被认为棘手了 80 年的问题,其上界自 1984 年以来一直没有改变,而它的解答需要借助来自遥远领域的工具。
Gowers 将其概括如下:如果是人类提交了这份工作,他会“毫不犹豫”地把它接收进《Annals of Mathematics》。此前任何由 AI 生成的证明都远未达到这种程度。
这一结果对数学本身说明了什么
参与该研究的几位数学家在随附论文中,借此反思 AI 对他们所在领域所带来的结构性后果。合著者 Daniel Litt 提出了令人不安的问题:为什么会存在一些著名问题,只需一个相对简短而巧妙的论证就能解决?他的猜测是:要么研究者一直坚持着次优假设——比如 Erdős 本人认为自己的猜想是正确的——要么就说明,这些解决方案需要依赖相关领域大多数人并不熟悉的方向中的想法。
“如果这些解释是正确的,我们应该感到有些不安,”Litt写道。“它们表明,朝着专业化和分隔化发展的激励,尽管可以理解,却让我们失去了一些高质量的科学。”Litt将人类的做法——研究者出于个人好奇深入钻研少数几个问题——与当前AI模式进行对比:后者是系统性地把整个问题清单逐一处理。这相当于“对数学问题的关注范围进行了大幅扩张”。
Gowers对自己的反应也直言不讳。起初他以为AI证明了这个猜想而不是否定了它,于是他花了一整个晚上“调整我的世界观:如果AI都能给出那样的证明,那么数学家们也许很快就要完了”。第二天早上,当错误被澄清后,他感到“非常松了一口气”。一个反例可以被想象为耐心和反复试错的结果;而真正的证明则需要“深刻洞见”,那会令人不安。
在配套论文中,Gowers提出了自己衡量证明难度的方法。他称之为“相对于专家的Kolmogorov复杂度”——也就是一位专家要独立重建该证明所需的最短提示序列长度。他初步的看法是:AI目前整体上并不比人类更强,但在某些问题类型上具有优势。它拥有“百科全书式的数学知识”,对时间管理也不那么担忧,因此“有能力相当努力地去证明那些看起来不太可能是真的命题”。
尽管如此,他表示,进展不会停滞。很快就会出现一些AI方案,“即使事后回看,我们也会很难把它们解释成只是比预期更容易”。即便AI还不能找到冗长而复杂的证明,“我们也很可能已经进入一个时代,在这个时代里,人类将很难在数学问题求解上与AI竞争。”
Bloom则采取了中间立场。面对他自己的测试问题——这个证明是否让领域学到了关于该问题的新东西——他的回答是一个“有所保留的肯定”。看起来,数论构造对于这类问题的说明力比任何人此前怀疑的都要强,而所需的数论也可能非常深奥。领域内一些人可能会失望,因为这项证明并没有带来“强有力的新几何工具”或意料之外的结构性结果,而这些大概才是猜想被完全证明时所需要的东西。这个解法,“事后看来”,是一个自然的推广,但“高度非平凡”。人类要找到它,得同时碰上四个罕见的巧合。
Bloom这样描述AI的优势:它把“超人的耐心水平”与“对大量技术工具的熟悉”结合在一起,并且固执地追寻“人类可能已经认为不值得花时间去探索的路径”。他的判断是:“知识的前沿本来就很崎岖,毫无疑问,在接下来的数月和数年里,我们会在数学的许多其他领域看到类似的成功,长期未解的开放问题将被AI通过揭示意想不到的联系并把现有技术工具推到极限而解决。”
人类与机器分工合作
OpenAI 发表的配套论文本身,也预示着未来 AI 与研究人员之间可能如何分工。根据 Bloom 的说法,模型生成的原始证明“完全有效”,但人类作者对其进行了“显著改进”。只有 Sawin 的精炼版本,才给出了可量化的改进幅度。发表于配套论文中的版本,比原始版本更短,也更具普适性。
这第二步最近成为 Tao 在斯坦福大学“数学的未来”研讨会上的演讲重点。Tao 认为,数学实践目前正经历一种“证明消化不良”:AI 系统生成并验证证明的速度越来越快,但人类的消化过程,也就是理解、解释、联系上下文并在成果基础上继续推进,已经跟不上了。他衡量一个解决方案是否真正完整的标准是:是否有人能够就此做一场报告并回答问题?在单位距离反例的案例中,9 位知名数学家同意正是去完成这项工作。这样的标准能否规模化,则完全是另一回事。
没有炒作的 AI 新闻——由人类精选
订阅 THE DECODER,享受无广告阅读、每周一次的 AI 新闻简报、我们独家的“AI Radar”前沿报告(每年 6 次)、完整档案访问权限,以及评论区访问权限。
来源与参考
收录于 2026-05-22