arXiv收紧对人工智能灌水论文的处罚

The Verge AI·5月16日 04:38 UTC·作者 Jay Peters

关键信息

Thomas Dietterich 表示，处罚只适用于存在“无可辩驳证据”证明作者没有检查输出的情况，例如虚构引用或模型留在稿件中的提示语。arXiv 还表示，内部流程要求先由审核员记录问题，再由分区负责人确认后才能实施封禁，而且作者可以提出申诉。

资讯摘要

arXiv 正在加强对预印本投稿中“人工智能灌水”内容的治理。负责 arXiv 计算机科学分区的 Thomas Dietterich 表示，作者对论文中签名的全部内容都负有责任，无论这些内容是如何生成的。新政策针对的是那些存在无可辩驳证据、表明作者没有核查 LLM 生成内容的投稿。典型例子包括虚构的参考文献，以及模型残留在稿件中的提示语或元注释，例如要求修改摘要、或者把实验真实数字补进去的说明。若出现这类情况，作者可能会被 arXiv 禁止投稿一年。此后，他们未来的投稿还必须先在有信誉的同行评审场所获得接收。

Dietterich 还表示，作者可以对封禁决定提出申诉，但这项措施只会用于非常明确的案例。按照内部流程，必须先由审核员记录问题，再由分区负责人确认，之后才会执行处罚。这并不是 arXiv 第一次针对低质量 AI 生成内容采取行动。去年，arXiv 已经修改规则，要求计算机科学综述和立场论文必须先经过同行评审，并且已经被会议或期刊接收后才能发布。arXiv 当时指出，大语言模型让这类内容可以被轻易批量生成，而大量投稿的综述文章往往只是带注释的参考书目，并没有实质性的开放研究问题讨论。

资讯正文

ArXiv 是一个颇受欢迎的预印本学术研究平台，如今正采取一项新措施，试图减少包含 AI 垃圾内容的论文数量。

据 ArXiv 计算机科学版块负责人 Thomas Dietterich 介绍，如果一篇论文存在“无可争辩的证据”表明作者没有核查 LLM 生成结果，例如出现了幻觉引用，或者残留了 LLM 写下的“元评论”，作者将被禁止使用 ArXiv 一年。此后，未来提交到 ArXiv 的论文还必须先被“有声望的同行评审机构”接收。

以下是他在 X 上所说的话：

> 提醒 @arxiv 作者：我们的行为准则规定，只要你以作者身份在论文上署名，每位作者就要对论文的全部内容负完全责任，不论这些内容是如何生成的。

> 如果生成式 AI 工具生成了不当语言、抄袭内容、带有偏见的内容、错误、失误、不正确的引用或误导性内容，而这些输出被纳入科学作品中，那么责任在作者。

> 我们最近已澄清对此类情况的处罚措施。如果一份投稿包含无可争辩的证据，表明作者没有核查 LLM 生成结果，这意味着我们无法信任论文中的任何内容。

> 处罚为：禁止使用 arXiv 1 年，之后的 arXiv 投稿必须先被有声望的同行评审机构接收。

> 无可争辩的证据示例：幻觉引用、来自 LLM 的元评论（“以下是 200 字摘要；你希望我做任何修改吗？”；“这个表格中的数据只是示意，请用你实验中的真实数字填充。”）

Dietterich 告诉 404Media，作者可以对封禁决定提出申诉。他还指出，这项政策只适用于“存在无可争辩证据的情况”，并且“我们的内部流程要求先由审核员记录问题，然后由版块负责人确认后，才会施加处罚”。

去年，ArXiv 还更新了政策，通过规定计算机科学综述文章和立场论文只有在经过同行评审并被会议或期刊接收后才能发表，来减少 AI 垃圾内容。ArXiv 当时表示：“大语言模型的出现使这类内容可以相对轻松地按需批量生成，而我们收到的大多数综述文章不过是带注释的参考文献目录，对开放研究问题并没有实质性讨论。”

来源与参考

收录于 2026-05-16