ChatGPT推高写作和编程课程成绩

The Decoder·6月21日 20:01 UTC·作者 Matthias Bastian

关键信息

这项研究覆盖了2018年至2025年的8个秋季学期，涉及德克萨斯州一所大型、选择性较强的公立研究型大学的319门课程、84个院系。研究发现A等成绩上升了13个百分点，约比2022年的基线高30%，平均GPA提高0.12；而针对口头展示作业的安慰剂测试则没有明显变化。

资讯摘要

一项新的加州大学伯克利分校研究认为，ChatGPT 正在以更像“外包作业”而不是“促进学习”的方式推高大学成绩。研究人员分析了德克萨斯州一所大型、选择性较强的公立研究型大学超过50万条成绩记录，发现自 ChatGPT 于2022年11月发布后，写作和编程任务较多的课程成绩明显上升。样本中，A等成绩的占比增加了13个百分点，平均GPA上升0.12，整体成绩分布也变窄，A-和B+被推到了A。研究覆盖2018年至2025年的8个秋季学期，共319门课程、84个院系，并用2022年秋季课程大纲中的作业结构来衡量每门课的AI暴露程度。结果显示，受影响最明显的是作业占比高的课程，因为这类任务最容易在无人监督的情况下被 AI 代写或辅助完成。

对于作业占总成绩高于中位数的课程，A等成绩还会额外上升16个百分点；而在作业占比较低的课程中，这种效应很小，且没有统计学显著性。作者认为，这种模式很难用普遍的学习提升来解释。研究还对口头展示作业做了安慰剂检验，而这类任务中 AI 的作用较小，结果没有看到成绩变化。论文最后指出，这种成绩膨胀会削弱成绩作为能力信号的价值，因为雇主和研究生项目可能因此更难识别学生的真实技能。

资讯正文

加州大学伯克利分校对超过50万条成绩的研究发现，自 ChatGPT 上线后，写作和编程任务占比较高的课程，成绩都出现了上升。这个现象主要出现在家庭作业中，说明人工智能替代了学生的实际完成工作，而不是改善了学习效果。

人工智能可能正在侵蚀大学成绩真正传达的信息。加州大学伯克利分校的一项新研究分析了得克萨斯州一所“规模较大、竞争激烈的公立研究型大学”中超过50万条成绩记录。趋势非常明显：在写作和编程作业占比较高的课程里，自 2022 年 11 月 ChatGPT 发布以来，成绩大幅上升。

A 等成绩所占比例上升了 13 个百分点，比 2022 年基线高出约 30%。平均 GPA 上升了 0.12 分，成绩分布也变得更集中。原本接近 A 的 A- 和 B+，正被推升成直接的 A。

这项研究追踪了 319 门课程、跨越 84 个院系的八个秋季学期（2018 年至 2025 年）的成绩趋势。每门课的人工智能暴露程度，依据 ChatGPT 出现之前的 2022 年秋季课程大纲中的作业构成来衡量。最关键的是写作和编程任务所占比例，这正是人工智能表现最强的领域。

家庭作业拉高了成绩，并不是考试分数

研究要回答的问题是：更高的成绩反映的是实际学习进步，还是只是人工智能代做了作业。为此，作者 Igor Chirikov 还研究了家庭作业在总成绩中所占的比重。

如果人工智能真的改善了学习，那么无论一门课更依赖家庭作业还是监考考试，成绩上升都应该出现。但如果人工智能只是替学生完成了那些无人监督的作业，那么这种影响就应该主要集中在家庭作业权重更高的课程里。

数据正是如此：在家庭作业占总成绩比重高于中位数的课程中，与人工智能暴露程度相同、但家庭作业权重低于中位数的课程相比，A 等成绩又额外上升了 16 个百分点。在那些家庭作业权重较低的课程里，这种影响很小，而且在统计上并不显著。Chirikov 写道，这一结果“很难仅用普遍的学习收益或筛选效应来解释”。

一项安慰剂检验也支持了这一点。对于口头展示作业，人工智能的作用要小得多，因此成绩并没有明显变化。

成绩作为信号的价值正在下降

美国大学的成绩膨胀并不新鲜。研究指出，在哈佛大学，A 等成绩的比例从 2005 年的 24% 上升到 2025 年的 60.2%。更早的研究曾把这一现象归因于奖励宽松评分的教学评估、大学之间的竞争以及机构性的评分政策。

但 Chirikov 认为，人工智能的作用不同。此前的每一种推动因素，都是在评分阶段才开始起作用，也就是学生交上作业之后。人工智能改变的是作业本身的生成方式，在教师看到学生成果之前就已经介入。

研究警告说，如果写作和编程密集型课程中的成绩越来越反映的是 AI 生成的输出，而不是真实能力，那么雇主和研究生项目就可能做出更差的筛选决策。

Chirikov 还指出了一个反馈循环：如果 AI 在大学阶段接管了技能培养任务，那么毕业生最终在恰恰是 AI 最擅长的领域里反而会变得更弱。这可能会加速自动化，并扩大就业市场中的技能差距。

作为解决办法，这项研究建议重新思考考试形式。把所有内容都改成监考考试还不够，而且也并不简单。更好的做法是设计一些作业，或者限制 AI 的使用，或者有意把它纳入其中，例如通过记录工作过程，或者通过后续互动来证明理解。

就连 OpenAI 首席执行官 Sam Altman 也担心批判性思维能力会下降

OpenAI 首席执行官 Sam Altman 在最近的一次采访中承认，在 ChatGPT 发布三年半后，教育系统几乎没有对 AI 作出回应。他原本预计会有一年的作弊期，然后是系统性改革。可现实是，他说不出任何有意义的系统性变化。若没有这种变化，他警告称，批判性思维能力有“显著萎缩”的风险。

Altman 仍然相信教育可以适应，就像它在此前几次技术飞跃中所做的那样。但有些技能，比如写作和编程，应该继续教授，因为它们本身就在训练大脑。

“我是那种通过写作来思考的人，我会写很多从来不会给任何人看的东西，但它对我理清思路仍然很重要。这就是为什么我很感激自己学会了写作。人们对编程也有同样的说法，”Altman 说。

挪威最近基本禁止了在小学使用 AI 工具，并且也限制了它们在中学中的使用。首相 Jonas Gahr Stoere 表示，不加批判地使用 AI 会诱使学生跳过重要的学习步骤。

来源与参考

收录于 2026-06-22