Meta 的 AI 审核推进引发员工担忧

The Decoder·6月25日 18:07 UTC·作者 Maximilian Schreiner

关键信息

Meta 表示，自 3 月以来的测试显示，这些语言模型在执行内容政策时比人工少 13% 的错误，并能多发现 10% 的真实违规内容，而且相比传统 ML 分类器，它们更擅长理解细微语义和多语言内容。但员工称，模型仍会误删无害内容或进行影子封禁，而且监督机制没有跟上推进速度。

资讯摘要

Meta 正在快速把内容审核工作从人工转向 AI，2025 年大约一半的审核请求已经由大语言模型处理。根据《金融时报》的报道，公司希望到今年年底，某些内容类型中这一比例超过 90%，而这一变化预计每年可为公司节省数十亿美元。Meta 对“省钱”这种说法并不认同，而是强调质量提升：公司称，自 3 月以来的测试显示，其模型在执行内容政策时比人工少 13% 的错误，并能多识别 10% 的真实违规内容。Meta 还表示，大语言模型比传统的机器学习分类器更擅长理解讽刺、语境细微差别以及多语言内容。但员工在报道中描绘了不同的情况。

他们认为这次推进速度太快，内部监督没有跟上，系统仍会误删无害内容，甚至对本不该受罚的帖子进行影子封禁。报道称，这种转型也已经带来裁员，尤其影响外部承包商。与此同时，Meta 还在更换底层模型：公司过去在审核和支持任务中使用 Google 的 Gemini，但最近要求员工改用自家的基础模型 Muse Spark。相关模型是根据人类审核员过去的判定结果训练出来的，目的是在大规模场景下复制这些审核判断。

资讯正文

Meta员工警告称，AI审核推广速度太快

据《金融时报》报道，Meta在2025年已经用大语言模型替代了大约一半的人类审核请求，并计划在年底前把这一比例提升到某些内容类型的90%以上。预计这一转变每年可为公司节省数十亿美元。Meta对成本方面的说法提出异议，转而强调质量，称自3月以来的测试显示，在执行内容政策时，其语言模型比人类少13%的错误，同时能多发现10%的实际违规。与在讽刺或不断演变的语言面前表现吃力的传统机器学习分类器不同，这些语言模型据称更能把握细微差别，并覆盖更多语言。

员工描绘的却是另一番景象。一位内部人士表示，这些模型仍然会移除无害内容，或对其实施 shadow-ban，而如此快速的推广并没有足够的监督。这一转型已经在导致裁员，尤其是外包承包商受到的影响更大。

《金融时报》还报道称，幕后还有一场模型替换正在进行。Meta此前一直在使用谷歌的Gemini进行审核和支持，但最近已通知员工改用其新的基础模型Muse Spark。相关模型是根据人工审核员过去做出的决定训练出来的。

来源与参考

收录于 2026-06-26