arXiv收紧AI代写论文规则

TechCrunch AI·5月17日 02:54 UTC·作者 Anthony Ha

关键信息

这并不是对LLM使用的全面禁止；arXiv强调，无论内容如何生成，作者都要对提交的一切负责。Dietterich表示，像“幻觉”参考文献、与LLM之间的注释等都可能成为处罚依据，但必须由审核人员和分区主席确认，作者也可以提出申诉。

资讯摘要

arXiv是一个被广泛使用的预印本仓库，正在加强对科研写作中不谨慎使用大语言模型的监管。这个平台在计算机科学和数学等领域扮演着重要的论文传播渠道，尽管论文发布时通常还没有经过同行评审。此前，arXiv已经采取过措施，试图减少低质量的AI生成投稿，例如要求首次投稿者获得资深作者的推荐或背书。与此同时，在Cornell托管超过20年之后，arXiv正在转型为独立的非营利组织，这被认为有助于其筹集更多资金来应对AI垃圾内容等问题。

周四，Thomas Dietterich发文称，如果一篇投稿存在确凿证据表明作者没有核查LLM生成结果，那么审核方就无法信任论文的其余部分。他指出，幻觉引用以及LLM里的注释或来自LLM的注释，都可能构成这种证据。按照新做法，相关作者可能会被arXiv禁投一年，之后再次投稿前还必须先被有声望的同行评审机构接受。Dietterich同时强调，这项政策并不是要全面禁止使用LLM，而是要求作者对提交内容承担全部责任，包括错误引用、偏见内容、抄袭、错误和误导性信息等。

资讯正文

ArXiv 是一个广泛使用的预印本研究开放仓库，如今正进一步打击科研论文中对大型语言模型的粗心使用。

尽管论文会在经过同行评审之前先发布到该网站上，但 arXiv（读作“archive”）已经成为计算机科学和数学等领域研究传播的主要渠道之一，而该网站本身也已成为研究科学趋势的数据来源。

ArXiv 早已采取措施，遏制数量不断增加的低质量、由 AI 生成的论文，例如要求首次投稿者获得一位已建立声誉作者的背书。而在由康奈尔大学托管 20 多年之后，该组织正在转型为独立的非营利机构，这应当能让它筹集更多资金来应对诸如 AI 垃圾内容之类的问题。

在最新举措中，arXiv 计算机科学分部主席 Thomas Dietterich 周四发文称：“如果一份投稿包含不可辩驳的证据，表明作者并未检查 LLM 生成结果，那么这意味着我们不能相信论文中的任何内容。”

Dietterich 说，这种不可辩驳的证据可能包括诸如“虚构引用”以及与 LLM 的评论或来自 LLM 的评论等。如果发现此类证据，论文作者将面临“被 arXiv 禁止投稿 1 年，随后其后续 arXiv 投稿必须先被一个有声誉的同行评审机构接收”的处罚。

需要注意的是，这并不是完全禁止使用 LLM，而是坚持作者必须对内容承担“全部责任”，正如 Dietterich 所说，“无论内容是如何生成的”。因此，如果研究人员直接从 LLM 中复制粘贴“不恰当的语言、抄袭内容、带偏见的内容、错误、失误、不正确的引用或误导性内容”，他们仍然要为此负责。

Dietterich 告诉 404 Media，这将是一项“一次违规”的规则，但在施加处罚之前，审核员必须标记问题，且分部主席必须确认相关证据。作者也将能够对这一决定提出上诉。

近期经过同行评审的研究发现，生物医学研究中伪造引用的情况正在上升，原因很可能是 LLM——不过公平地说，科学家并不是唯一被抓到使用 AI 编造引用的人。

OpenAI reportedly preparing legal action against Apple; it wouldn’t be the first partner to feel burned

Musk’s xAI is operating nearly 50 gas turbines unchecked at its Mississippi data center

AI voice startup Vapi reaches $500 million valuation after beating Amazon Ring and 40 competitors

Amazon launches 30-minute delivery across the US

来源与参考

收录于 2026-05-17