AI检测器对人类写作判断差异巨大

The Decoder··作者 Matthias Bastian

关键信息

作者公会警告说,即使表现较好的工具也不应被当作最终结论,因为检测准确率会随时间变化。Pangram首席执行官Max Spero表示,该系统本质上像一个黑箱,作者公会则认为出版社在做决定前应披露方法,并给作者申辩机会。

资讯摘要

作者公会使用十篇发表于2020年至2022年的文章进行了一次小规模测试,这些文章都写在生成式AI普及之前。测试结果显示,Pangram和Grammarly都把全部人类写作样本正确识别为人类。Originality.ai的表现也不错,而Sidekicker的结果最差,它把每篇文章都标成了主要由AI生成,其中两篇甚至被打了100% AI分数。ZeroGPT同样不稳定,对这些人类写作样本有时给出很高的AI比例。作者公会表示,这类误报非常严重,因为它们可能影响作者的合同和声誉。

公会同时警告,即便是表现较好的工具,也不应作为做决定的唯一依据,因为检测器会不断变化,不能被默认长期可靠。Pangram首席执行官Max Spero称他的检测器本质上是黑箱,但他认为语言模型通常会在写作的均匀性和论证结构上暴露自己。作者公会则指出,专业人类文本往往与AI输出共享相似的统计模式,因为模型正是用这类写作训练出来的,这就形成了一个悖论:写得越好的人类文本,越可能看起来像机器生成。文章最后强调,这次测试主要说明这些工具在识别人类写作方面的能力,并不能证明它们同样擅长识别AI写作;它们的价值更可能在于减少误报,而不是保证检测绝对准确。

AI检测器对人类写作判断差异巨大

资讯正文

作者公会测试发现,有些 AI 检测器能完美识别人类写作,而另一些则对每一篇文本都判错。

在作者公会的一项测试中,Pangram 和 Grammarly 的 AI 检测器都能正确地将每一篇人类撰写的文本识别为人类作品。

Originality.ai 的表现也不错。该测试使用了作者公会在 2020 年至 2022 年间发布的 10 篇文章,那时生成式 AI 还没有成为主流。Sidekicker 的结果最差。每一篇文章都被标记为主要由 AI 生成,其中两篇得分达到 100%。ZeroGPT 也不可靠,它有时会给所有这些人类撰写的文本报出很高的 AI 百分比。

误报可能让作者丢掉合约

不过,这个最古老、规模最大的作家职业组织警告说,即便是表现最好的工具,也绝不应成为任何决定的唯一依据。这些工具不断变化,它们的准确性不能想当然。

Pangram 的首席执行官 Max Spero 最近解释说,他的检测器本质上是一个黑箱,无法详细说明为什么一段文本会被标记为 AI 生成。语言模型确实会通过某种一致性暴露自己,尤其是在构建论点的方式上。Spero 说,人类写作的变化则丰富得多。

根据作者公会的说法,专业写作者的文本与 AI 输出共享许多相同的统计模式,原因很简单:语言模型正是用这类写作训练出来的。错误结果会让作者丢掉合约和声誉,因此出版商应当公开其方法,并始终给作者机会为自己辩护。

这造成了一个令人不安的悖论。一个花了几十年打磨清晰、简洁和精准的作者,按照定义,写出来的内容会与 AI 学到的产出方式有重叠。检测工具无法区分一位已经掌握写作技艺的人类作者与一台学会模仿的机器,因为在这些工具所运行的层面上,真正可找出的差异可能并不多。

作者公会

话虽如此,Pangram 和 Originality 能稳定地把人类撰写的文本识别为人类,并不一定意味着它们同样擅长发现 AI 生成内容。这些结果主要说明,这些工具的调校目标是尽量减少误报,也就是避免把人类文本错误标记为 AI。大量由 AI 撰写或参与撰写的文本,仍然可能漏网。此次测试所体现的可靠性,首先和最重要的是正确识别人类写作。

检测背后的文化争论

错误还会继续发生,这也是这些检测器的实用性不断受到质疑的原因。尤其是在 AI 可能确实是一个有用的写作工具时,这一点更为突出,而更广泛的争论常常把“用 AI 写作”和“用 AI 思考”混为一谈。

像 Pangram 首席执行官 Max Spero 这样的检测工具倡导者,会诉诸写作者与读者之间的一种社会契约来为其商业模式辩护。写作者投入时间和精力去塑造一个想法;读者则投入时间去与之互动。Spero 说,如果 AI 把写作成本降到零,就会产生糟糕的激励,导致人们向互联网倾倒大量毫无价值的内容,而读者花在消费这些内容上的时间,甚至比作者创作它们所花的时间还要多。

不过,一篇文字的价值究竟来自打字本身,还是来自选题、创意、视角、故事、研究、论证,以及背后的判断,这又是另一个问题了。AI 文本检测是否真的能对毫无价值内容的泛滥起到什么作用,也同样如此。

来源与参考

  1. 原始链接
  2. Authors Guild test finds some AI detectors perfectly identify human writing while others fail on every single text

收录于 2026-06-26