arXiv收紧AI代写论文规则

TechCrunch AI··作者 Anthony Ha

关键信息

这并不是对LLM使用的全面禁止;arXiv强调,无论内容如何生成,作者都要对提交的一切负责。Dietterich表示,像“幻觉”参考文献、与LLM之间的注释等都可能成为处罚依据,但必须由审核人员和分区主席确认,作者也可以提出申诉。

资讯摘要

arXiv是一个被广泛使用的预印本仓库,正在加强对科研写作中不谨慎使用大语言模型的监管。这个平台在计算机科学和数学等领域扮演着重要的论文传播渠道,尽管论文发布时通常还没有经过同行评审。此前,arXiv已经采取过措施,试图减少低质量的AI生成投稿,例如要求首次投稿者获得资深作者的推荐或背书。与此同时,在Cornell托管超过20年之后,arXiv正在转型为独立的非营利组织,这被认为有助于其筹集更多资金来应对AI垃圾内容等问题。

周四,Thomas Dietterich发文称,如果一篇投稿存在确凿证据表明作者没有核查LLM生成结果,那么审核方就无法信任论文的其余部分。他指出,幻觉引用以及LLM里的注释或来自LLM的注释,都可能构成这种证据。按照新做法,相关作者可能会被arXiv禁投一年,之后再次投稿前还必须先被有声望的同行评审机构接受。Dietterich同时强调,这项政策并不是要全面禁止使用LLM,而是要求作者对提交内容承担全部责任,包括错误引用、偏见内容、抄袭、错误和误导性信息等。

arXiv收紧AI代写论文规则

资讯正文

ArXiv 是一个广泛使用的预印本研究开放仓库,如今正进一步打击科研论文中对大型语言模型的粗心使用。

尽管论文会在经过同行评审之前先发布到该网站上,但 arXiv(读作“archive”)已经成为计算机科学和数学等领域研究传播的主要渠道之一,而该网站本身也已成为研究科学趋势的数据来源。

ArXiv 早已采取措施,遏制数量不断增加的低质量、由 AI 生成的论文,例如要求首次投稿者获得一位已建立声誉作者的背书。而在由康奈尔大学托管 20 多年之后,该组织正在转型为独立的非营利机构,这应当能让它筹集更多资金来应对诸如 AI 垃圾内容之类的问题。

在最新举措中,arXiv 计算机科学分部主席 Thomas Dietterich 周四发文称:“如果一份投稿包含不可辩驳的证据,表明作者并未检查 LLM 生成结果,那么这意味着我们不能相信论文中的任何内容。”

Dietterich 说,这种不可辩驳的证据可能包括诸如“虚构引用”以及与 LLM 的评论或来自 LLM 的评论等。如果发现此类证据,论文作者将面临“被 arXiv 禁止投稿 1 年,随后其后续 arXiv 投稿必须先被一个有声誉的同行评审机构接收”的处罚。

需要注意的是,这并不是完全禁止使用 LLM,而是坚持作者必须对内容承担“全部责任”,正如 Dietterich 所说,“无论内容是如何生成的”。因此,如果研究人员直接从 LLM 中复制粘贴“不恰当的语言、抄袭内容、带偏见的内容、错误、失误、不正确的引用或误导性内容”,他们仍然要为此负责。

Dietterich 告诉 404 Media,这将是一项“一次违规”的规则,但在施加处罚之前,审核员必须标记问题,且分部主席必须确认相关证据。作者也将能够对这一决定提出上诉。

近期经过同行评审的研究发现,生物医学研究中伪造引用的情况正在上升,原因很可能是 LLM——不过公平地说,科学家并不是唯一被抓到使用 AI 编造引用的人。

OpenAI reportedly preparing legal action against Apple; it wouldn’t be the first partner to feel burned

Musk’s xAI is operating nearly 50 gas turbines unchecked at its Mississippi data center

AI voice startup Vapi reaches $500 million valuation after beating Amazon Ring and 40 competitors

Amazon launches 30-minute delivery across the US

来源与参考

  1. 原始链接
  2. Research repository ArXiv will ban authors for a year if they let AI do all the work | TechCrunch

收录于 2026-05-17