ChatGPT推高写作和编程课程成绩

The Decoder··作者 Matthias Bastian

关键信息

这项研究覆盖了2018年至2025年的8个秋季学期,涉及德克萨斯州一所大型、选择性较强的公立研究型大学的319门课程、84个院系。研究发现A等成绩上升了13个百分点,约比2022年的基线高30%,平均GPA提高0.12;而针对口头展示作业的安慰剂测试则没有明显变化。

资讯摘要

一项新的加州大学伯克利分校研究认为,ChatGPT 正在以更像“外包作业”而不是“促进学习”的方式推高大学成绩。研究人员分析了德克萨斯州一所大型、选择性较强的公立研究型大学超过50万条成绩记录,发现自 ChatGPT 于2022年11月发布后,写作和编程任务较多的课程成绩明显上升。样本中,A等成绩的占比增加了13个百分点,平均GPA上升0.12,整体成绩分布也变窄,A-和B+被推到了A。研究覆盖2018年至2025年的8个秋季学期,共319门课程、84个院系,并用2022年秋季课程大纲中的作业结构来衡量每门课的AI暴露程度。结果显示,受影响最明显的是作业占比高的课程,因为这类任务最容易在无人监督的情况下被 AI 代写或辅助完成。

对于作业占总成绩高于中位数的课程,A等成绩还会额外上升16个百分点;而在作业占比较低的课程中,这种效应很小,且没有统计学显著性。作者认为,这种模式很难用普遍的学习提升来解释。研究还对口头展示作业做了安慰剂检验,而这类任务中 AI 的作用较小,结果没有看到成绩变化。论文最后指出,这种成绩膨胀会削弱成绩作为能力信号的价值,因为雇主和研究生项目可能因此更难识别学生的真实技能。

ChatGPT推高写作和编程课程成绩

资讯正文

加州大学伯克利分校对超过50万条成绩的研究发现,自 ChatGPT 上线后,写作和编程任务占比较高的课程,成绩都出现了上升。这个现象主要出现在家庭作业中,说明人工智能替代了学生的实际完成工作,而不是改善了学习效果。

人工智能可能正在侵蚀大学成绩真正传达的信息。加州大学伯克利分校的一项新研究分析了得克萨斯州一所“规模较大、竞争激烈的公立研究型大学”中超过50万条成绩记录。趋势非常明显:在写作和编程作业占比较高的课程里,自 2022 年 11 月 ChatGPT 发布以来,成绩大幅上升。

A 等成绩所占比例上升了 13 个百分点,比 2022 年基线高出约 30%。平均 GPA 上升了 0.12 分,成绩分布也变得更集中。原本接近 A 的 A- 和 B+,正被推升成直接的 A。

这项研究追踪了 319 门课程、跨越 84 个院系的八个秋季学期(2018 年至 2025 年)的成绩趋势。每门课的人工智能暴露程度,依据 ChatGPT 出现之前的 2022 年秋季课程大纲中的作业构成来衡量。最关键的是写作和编程任务所占比例,这正是人工智能表现最强的领域。

家庭作业拉高了成绩,并不是考试分数

研究要回答的问题是:更高的成绩反映的是实际学习进步,还是只是人工智能代做了作业。为此,作者 Igor Chirikov 还研究了家庭作业在总成绩中所占的比重。

如果人工智能真的改善了学习,那么无论一门课更依赖家庭作业还是监考考试,成绩上升都应该出现。但如果人工智能只是替学生完成了那些无人监督的作业,那么这种影响就应该主要集中在家庭作业权重更高的课程里。

数据正是如此:在家庭作业占总成绩比重高于中位数的课程中,与人工智能暴露程度相同、但家庭作业权重低于中位数的课程相比,A 等成绩又额外上升了 16 个百分点。在那些家庭作业权重较低的课程里,这种影响很小,而且在统计上并不显著。Chirikov 写道,这一结果“很难仅用普遍的学习收益或筛选效应来解释”。

一项安慰剂检验也支持了这一点。对于口头展示作业,人工智能的作用要小得多,因此成绩并没有明显变化。

成绩作为信号的价值正在下降

美国大学的成绩膨胀并不新鲜。研究指出,在哈佛大学,A 等成绩的比例从 2005 年的 24% 上升到 2025 年的 60.2%。更早的研究曾把这一现象归因于奖励宽松评分的教学评估、大学之间的竞争以及机构性的评分政策。

但 Chirikov 认为,人工智能的作用不同。此前的每一种推动因素,都是在评分阶段才开始起作用,也就是学生交上作业之后。人工智能改变的是作业本身的生成方式,在教师看到学生成果之前就已经介入。

研究警告说,如果写作和编程密集型课程中的成绩越来越反映的是 AI 生成的输出,而不是真实能力,那么雇主和研究生项目就可能做出更差的筛选决策。

Chirikov 还指出了一个反馈循环:如果 AI 在大学阶段接管了技能培养任务,那么毕业生最终在恰恰是 AI 最擅长的领域里反而会变得更弱。这可能会加速自动化,并扩大就业市场中的技能差距。

作为解决办法,这项研究建议重新思考考试形式。把所有内容都改成监考考试还不够,而且也并不简单。更好的做法是设计一些作业,或者限制 AI 的使用,或者有意把它纳入其中,例如通过记录工作过程,或者通过后续互动来证明理解。

就连 OpenAI 首席执行官 Sam Altman 也担心批判性思维能力会下降

OpenAI 首席执行官 Sam Altman 在最近的一次采访中承认,在 ChatGPT 发布三年半后,教育系统几乎没有对 AI 作出回应。他原本预计会有一年的作弊期,然后是系统性改革。可现实是,他说不出任何有意义的系统性变化。若没有这种变化,他警告称,批判性思维能力有“显著萎缩”的风险。

Altman 仍然相信教育可以适应,就像它在此前几次技术飞跃中所做的那样。但有些技能,比如写作和编程,应该继续教授,因为它们本身就在训练大脑。

“我是那种通过写作来思考的人,我会写很多从来不会给任何人看的东西,但它对我理清思路仍然很重要。这就是为什么我很感激自己学会了写作。人们对编程也有同样的说法,”Altman 说。

挪威最近基本禁止了在小学使用 AI 工具,并且也限制了它们在中学中的使用。首相 Jonas Gahr Stoere 表示,不加批判地使用 AI 会诱使学生跳过重要的学习步骤。

来源与参考

  1. 原始链接
  2. AI is inflating student grades, and the effect points to outsourced work, not better learning

收录于 2026-06-22