ChatGPT 教育研究因分析缺陷被撤稿

Ars Technica AI··作者 Jeremy Hsu

关键信息

这项研究是一篇元分析,汇总了 51 项既有研究,比较使用 ChatGPT 的实验组与未使用聊天机器人的对照组。论文最初发表于 Springer Nature 旗下的 Humanities & Social Sciences Communications,时间是 2025 年 5 月 6 日;在撤稿前,已经在 Springer Nature 的同行评审期刊中被引用 262 次,总引用达 504 次。

资讯摘要

一篇声称 OpenAI 的 ChatGPT 能提升学生学习效果的研究,在发表近一年后被撤稿。Springer Nature 表示,这篇论文在分析中存在差异问题,出版方因此不再对其结论保持信心。这篇论文之所以引发大量关注,是因为它看起来像是生成式 AI 有助于教育的早期定量证据。作者采用元分析方法,汇总了 51 项研究,评估 ChatGPT 对学习表现、学习感知以及高阶思维的影响。论文称,ChatGPT 对学习表现有较大的正向作用,对学习感知和高阶思维也有中等程度的正向作用。

爱丁堡大学的 Ben Williamson 表示,这项工作在社交媒体上被许多人当作生成式 AI 有利于学习者的首批强证据之一。Williamson 还认为,这篇论文把方法、对象和样本差异很大的研究混合在一起,导致这些结果无法可靠比较,因此它本就不该发表。他进一步质疑,从 ChatGPT 于 2022 年 11 月发布算起,仅过了两年半,是否真的已经出现了足够多高质量的教育研究。尽管已经撤稿,这篇论文此前仍获得了很高传播度,包括数百次引用和接近 50 万读者。

ChatGPT 教育研究因分析缺陷被撤稿

资讯正文

一项声称 OpenAI 的 ChatGPT 能对学生学习产生积极影响的研究,在发表将近一年后被撤稿。期刊出版商 Springer Nature 指出该研究分析中存在“差异”,且对其结论缺乏信心——但在此之前,这篇论文已经被引用数百次,并在社交媒体上广泛传播。

“这篇论文的作者对 ChatGPT 在学习成果方面的好处提出了一些非常引人注目的说法,”苏格兰爱丁堡大学数字教育研究中心和 Edinburgh Futures Institute 的高级讲师 Ben Williamson 在给 Ars 的电子邮件中表示。“在社交媒体上,许多人把它视为最早几篇提供硬核、黄金标准证据的研究之一,认为 ChatGPT 以及更广泛的生成式 AI 确实有益于学习者。”

这篇被撤稿的论文试图通过分析 51 项既有研究的结果,来量化“ChatGPT 对学生学习表现、学习感知和高阶思维的影响”。其元分析计算了在教育中使用 ChatGPT 的实验组与未使用这款 AI 聊天机器人的对照组之间的效应量。

据论文作者称,该分析所谓显示“ChatGPT 对提高学习表现有显著正向影响”,同时对“提升学习感知”以及“促进高阶思维”也有“中等程度的正向影响”。这篇现已撤稿的研究结果最初发表于 Springer Nature 于 2025 年 5 月 6 日出版的《Humanities & Social Sciences Communications》上。

“在某些情况下,看起来它是在综合一些质量非常差的研究,或者把那些由于方法、研究对象和样本差异极大而根本无法准确比较的研究结果混在一起,”Williamson 告诉 Ars。“这真的像是一篇一开始就不该发表的论文。”

Williamson 还质疑这篇论文发表的时机——距离 OpenAI 在 2022 年 11 月推出 ChatGPT 仅两年半。“不可能在这么短的时间内就完成、审阅并发表几十项关于 ChatGPT 和学习表现的高质量研究,”Williamson 说。

可能在撤稿后仍会延续的影响

自发表以来,这项研究已在 Springer Nature 旗下同行评审期刊发表的其他论文中被引用 262 次,并且来自同行评审和非同行评审来源的总引用次数达到 504 次。它还吸引了近 50 万名读者,并获得了足够多的网络关注,在期刊文章注意力评分方面进入了前 99 个百分位。

来源与参考

  1. 原始链接
  2. Influential study touting ChatGPT in education retracted over red flags