ChatGPT推高写作和编程课程成绩
The Decoder··作者 Matthias Bastian
关键信息
这项研究覆盖了2018年至2025年的8个秋季学期,涉及德克萨斯州一所大型、选择性较强的公立研究型大学的319门课程、84个院系。研究发现A等成绩上升了13个百分点,约比2022年的基线高30%,平均GPA提高0.12;而针对口头展示作业的安慰剂测试则没有明显变化。
资讯摘要
一项新的加州大学伯克利分校研究认为,ChatGPT 正在以更像“外包作业”而不是“促进学习”的方式推高大学成绩。研究人员分析了德克萨斯州一所大型、选择性较强的公立研究型大学超过50万条成绩记录,发现自 ChatGPT 于2022年11月发布后,写作和编程任务较多的课程成绩明显上升。样本中,A等成绩的占比增加了13个百分点,平均GPA上升0.12,整体成绩分布也变窄,A-和B+被推到了A。研究覆盖2018年至2025年的8个秋季学期,共319门课程、84个院系,并用2022年秋季课程大纲中的作业结构来衡量每门课的AI暴露程度。结果显示,受影响最明显的是作业占比高的课程,因为这类任务最容易在无人监督的情况下被 AI 代写或辅助完成。
对于作业占总成绩高于中位数的课程,A等成绩还会额外上升16个百分点;而在作业占比较低的课程中,这种效应很小,且没有统计学显著性。作者认为,这种模式很难用普遍的学习提升来解释。研究还对口头展示作业做了安慰剂检验,而这类任务中 AI 的作用较小,结果没有看到成绩变化。论文最后指出,这种成绩膨胀会削弱成绩作为能力信号的价值,因为雇主和研究生项目可能因此更难识别学生的真实技能。

资讯正文
加州大学伯克利分校对超过50万条成绩的研究发现,自 ChatGPT 上线后,写作和编程任务占比较高的课程,成绩都出现了上升。这个现象主要出现在家庭作业中,说明人工智能替代了学生的实际完成工作,而不是改善了学习效果。
人工智能可能正在侵蚀大学成绩真正传达的信息。加州大学伯克利分校的一项新研究分析了得克萨斯州一所“规模较大、竞争激烈的公立研究型大学”中超过50万条成绩记录。趋势非常明显:在写作和编程作业占比较高的课程里,自 2022 年 11 月 ChatGPT 发布以来,成绩大幅上升。
A 等成绩所占比例上升了 13 个百分点,比 2022 年基线高出约 30%。平均 GPA 上升了 0.12 分,成绩分布也变得更集中。原本接近 A 的 A- 和 B+,正被推升成直接的 A。
这项研究追踪了 319 门课程、跨越 84 个院系的八个秋季学期(2018 年至 2025 年)的成绩趋势。每门课的人工智能暴露程度,依据 ChatGPT 出现之前的 2022 年秋季课程大纲中的作业构成来衡量。最关键的是写作和编程任务所占比例,这正是人工智能表现最强的领域。
家庭作业拉高了成绩,并不是考试分数
研究要回答的问题是:更高的成绩反映的是实际学习进步,还是只是人工智能代做了作业。为此,作者 Igor Chirikov 还研究了家庭作业在总成绩中所占的比重。
如果人工智能真的改善了学习,那么无论一门课更依赖家庭作业还是监考考试,成绩上升都应该出现。但如果人工智能只是替学生完成了那些无人监督的作业,那么这种影响就应该主要集中在家庭作业权重更高的课程里。
数据正是如此:在家庭作业占总成绩比重高于中位数的课程中,与人工智能暴露程度相同、但家庭作业权重低于中位数的课程相比,A 等成绩又额外上升了 16 个百分点。在那些家庭作业权重较低的课程里,这种影响很小,而且在统计上并不显著。Chirikov 写道,这一结果“很难仅用普遍的学习收益或筛选效应来解释”。
一项安慰剂检验也支持了这一点。对于口头展示作业,人工智能的作用要小得多,因此成绩并没有明显变化。
成绩作为信号的价值正在下降
美国大学的成绩膨胀并不新鲜。研究指出,在哈佛大学,A 等成绩的比例从 2005 年的 24% 上升到 2025 年的 60.2%。更早的研究曾把这一现象归因于奖励宽松评分的教学评估、大学之间的竞争以及机构性的评分政策。
但 Chirikov 认为,人工智能的作用不同。此前的每一种推动因素,都是在评分阶段才开始起作用,也就是学生交上作业之后。人工智能改变的是作业本身的生成方式,在教师看到学生成果之前就已经介入。
研究警告说,如果写作和编程密集型课程中的成绩越来越反映的是 AI 生成的输出,而不是真实能力,那么雇主和研究生项目就可能做出更差的筛选决策。
Chirikov 还指出了一个反馈循环:如果 AI 在大学阶段接管了技能培养任务,那么毕业生最终在恰恰是 AI 最擅长的领域里反而会变得更弱。这可能会加速自动化,并扩大就业市场中的技能差距。
作为解决办法,这项研究建议重新思考考试形式。把所有内容都改成监考考试还不够,而且也并不简单。更好的做法是设计一些作业,或者限制 AI 的使用,或者有意把它纳入其中,例如通过记录工作过程,或者通过后续互动来证明理解。
就连 OpenAI 首席执行官 Sam Altman 也担心批判性思维能力会下降
OpenAI 首席执行官 Sam Altman 在最近的一次采访中承认,在 ChatGPT 发布三年半后,教育系统几乎没有对 AI 作出回应。他原本预计会有一年的作弊期,然后是系统性改革。可现实是,他说不出任何有意义的系统性变化。若没有这种变化,他警告称,批判性思维能力有“显著萎缩”的风险。
Altman 仍然相信教育可以适应,就像它在此前几次技术飞跃中所做的那样。但有些技能,比如写作和编程,应该继续教授,因为它们本身就在训练大脑。
“我是那种通过写作来思考的人,我会写很多从来不会给任何人看的东西,但它对我理清思路仍然很重要。这就是为什么我很感激自己学会了写作。人们对编程也有同样的说法,”Altman 说。
挪威最近基本禁止了在小学使用 AI 工具,并且也限制了它们在中学中的使用。首相 Jonas Gahr Stoere 表示,不加批判地使用 AI 会诱使学生跳过重要的学习步骤。
来源与参考
收录于 2026-06-22