Meta监督委员会:社区笔记无法应对AI虚假信息

The Decoder··作者 Maximilian Schreiner

收录于 2026-03-28

Meta监督委员会:社区笔记无法应对AI虚假信息

关键信息

仅约6%的笔记提案会被发布,平均延迟超过24小时——远超误导性内容的传播高峰期;同时,收到笔记的内容发布者不会受到任何惩罚或影响。

资讯摘要

Meta的监督委员会对‘社区笔记’进行了严厉批评,该系统是在终止为期十年的专业事实核查项目后推出的。委员会发现,该系统存在严重延迟、极低的发布率(仅6%的提案被采纳),并容易受到使用AI工具的有组织操纵。与过去可降低虚假内容曝光度或禁止广告投放的事实核查不同,社区笔记不会影响内容的传播范围或收入。

委员会警告称,AI使操纵更加容易,包括大规模创建账号和战略性抑制好评。在某些国家,委员会建议不应推出该计划。

资讯正文

Meta自己的监督机构警告称,社区笔记无法应对人工智能制造的虚假信息

《解码器》

Meta的监督委员会对社区笔记的全球扩展计划进行了审查。其结论是:该系统速度太慢、人员配备不足,且极易受到操纵,尤其是在人工智能生成虚假信息激增的背景下。在某些国家,Meta根本不应推出该计划。

Meta监督委员会在一项全面分析中得出了一个并不意外的结论:社区笔记——Meta在美国用来取代专业事实核查的系统——存在明显缺陷。委员会写道:“笔记发布延迟、已发布笔记数量有限,以及对更广泛信息环境可靠性的依赖,严重质疑了社区笔记在实质性解决与伤害相关的虚假信息方面的能力。”

Meta在特朗普总统第二个任期开始时宣布推出社区笔记,同时结束了运行约十年的专业事实核查项目。

问题因委员会明确指出的一个发展而更加严重:由人工智能驱动的工具正在促进大规模账号和网络的创建与管理,这些账号和网络可能操纵该系统。覆盖范围差距巨大:根据Meta的数据,美国推出社区笔记的前六个月里,仅发布了约900条笔记;而在同期的欧盟地区,专业事实核查员帮助Meta为大约3500万条Facebook帖子添加了标签,国际事实核查网络主任安吉·德布尼克·霍兰指出。

只有6%的提案笔记最终被发布

社区笔记系统基于X(原推特)开源算法构建。用户可以为公开帖子提出背景注释,其他用户则将其标记为“有帮助”或“无帮助”。只有当所谓的桥梁算法确定通常持不同意见的用户都给某条笔记打了“有帮助”后,该笔记才会被发布。

实际上,大多数笔记无法通过这一门槛。根据Meta于2025年9月发布的更新数据,所有提案笔记中仅有约6%最终被发布。一项研究显示,在X平台上,该比例为8.3%,平均发布时间延迟达26小时,“远超多数误导性帖子的峰值可见度时间”。另一项分析则将平均延迟时间定为65.7小时。根据同一项研究,在2021年1月至2025年1月期间,X平台上提出的87.7%的笔记始终停留在“需要更多评分”类别中,从未发布。

与旧的事实核查项目相比,一个关键区别在于:收到社区笔记的内容不会被降权,也不会从推荐中移除,据委员会指出。委员会表示:“发布内容若收到社区笔记,不会受到任何处罚,也不会影响传播范围或收益。”相比之下,在专业事实核查项目下,被判定为虚假或误导的内容可能会被降低分发优先级,并被拒绝用于广告投放。

Meta自身的监督机构警告称,社区笔记无法应对人工智能制造的虚假信息。

该监督委员会明确指出,该系统容易受到有组织操纵的影响,而这种风险因人工智能工具的使用而显著加剧。分析报告称:‘随着人工智能促进账户和网络的大规模创建与运作,这一风险只会变得更加严重。’委员会还指出,由人工智能驱动的贡献者可能带来风险:‘恶意行为者可以微调模型,以微妙地偏袒某些叙事、选择性地呈现证据或利用评分机制——同时仍表现出中立姿态。’

对X平台社区笔记的最新研究也显示:‘一小部分(5%至20%)不良评分者可以战略性地压制特定的有用笔记。’另一个漏洞在于,根据委员会的说法,发布的笔记要等到达成共识两周后才会锁定。在这段窗口期内,有组织的行为者可以通过大量负面评分来删除某条笔记。

Meta向委员会表示,公司‘不打算允许AI撰写笔记(即由AI驱动的聊天机器人或代理)在Meta平台上提交社区笔记;贡献者可以使用AI辅助写作,但必须由真人以自己的名义提交笔记。’公司还表示,截至目前,‘尚未发现任何有组织的不真实行为或对系统的滥用。’然而,委员会指出,Meta提供的信息并不清楚其防护措施是否足以应对潜在威胁的规模。

南波特骚乱:一条笔记覆盖上千条虚假信息

该系统在危机情境中的缺陷尤为明显。委员会援引了对2024年英国南波特骚乱的一项调查:五个传播虚假信息的账号累计获得超过4.3亿次观看。在骚乱高峰期,这些账号发布了1060条帖子,其中仅有一条被标注了社区笔记。

委员会得出明确结论:在经历危机或长期冲突的国家,不应引入社区笔记功能。因为在这些情况下,煽动暴力的门槛更低,针对特定群体的笔记‘更容易导致线下伤害’。这一点得到了Meta在缅甸和埃塞俄比亚通过未能有效管理仇恨内容而间接助长少数族裔种族灭绝事件的案例印证。2018年,Facebook曾就其在缅甸‘线下暴力’中的角色道歉。

尤其令人担忧的是,委员会指出,Meta‘并未制定有关在危机情境下使用该产品的规定,包括调整、修改或暂停该功能。’

少数群体可能系统性地处于不利地位

该系统的结构性弱点与其算法有关。正如委员会所指出的,它将社会分裂简化为单一维度进行建模。‘Meta未提供任何信息表明其项目会实质性区别于X平台的方案。’在社会分化无法简化为单一轴线的国家,例如政治、民族、宗教和语言冲突交织的情况下,这可能导致少数群体被系统性边缘化。

Meta自身的监督机构警告称,社区笔记无法应对人工智能制造的虚假信息。该委员会描述了一个具体情境:当主流群体对少数群体存在共同偏见时,这种偏见可以成为原本意见相左的多数群体之间的‘桥梁’。针对少数群体的有害笔记因此可能达到共识阈值并被发布。一个南亚非政府组织联盟向委员会提供了证据,证明在印度的X平台社区笔记中就存在此类动态,当地的政治分歧涉及种族、宗教、语言和种姓等多重且交错的归属关系。

此外还存在语言维度的问题:目前该系统仅支持六种语言(英语、西班牙语、中文、越南语、法语和葡萄牙语)。研究表明,在X平台上非英语的笔记被评级和发布的频率远低于英语笔记。在人权记录恶劣的国家,委员会还指出,如果贡献者的匿名性遭到破坏,将危及其安全——这涉及隐私权(《公民权利和政治权利国际公约》第17条)、人身安全(第9条)乃至生命权(第6条)。

委员会建议分阶段推广,并设定严格的排除标准。委员会列出了针对计划中的国际扩展的一系列具体建议:应暂时排除人权记录恶劣且公民社会薄弱的国家,直到Meta能证明其具备强有力的贡献者隐私保护措施,包括‘在对抗条件下进行红队测试的证据、明确处理执法机构数据请求的政策以及风险缓解措施的存在’。同样适用于正在经历危机或冲突的国家,以及历史上存在有组织虚假信息网络的国家。

针对选举,委员会建议特别谨慎:如果Meta通过产品测试、风险评估和人权尽职调查确定其防护措施不足,则不应在重大选举前或期间引入社区笔记。对于社会结构复杂多元的国家,委员会建议‘极度谨慎’,但不作全面排除。互联网接入持续受阻的国家也应被排除。

Meta需在初期推广阶段每六个月向委员会提供用于指导扩张的标准或风险矩阵。委员会还呼吁‘充分透明度、报告机制以及研究人员获取Meta社区笔记表现数据的权限’。不过,Meta并无法律义务遵守委员会的建议。

事实核查与社区笔记并非相互排斥。

Meta自己的监督机构警告称,社区笔记无法应对人工智能虚假信息。

该董事会明确强调,社区笔记和专业事实核查“不应被视为相互排斥的工具”。研究显示,在X平台上的社区笔记引用的事实核查来源比此前报告的多出多达五倍。另一项研究表明,事实核查组织是发布的笔记中“全球第三大使用参考来源”。因此,减少对事实核查机构的支持也会削弱社区笔记本身的质量,因为贡献者将更少可靠的来源可以引用。

无夸大报道的AI新闻——由人类精选

作为THE DECODER订阅者,您将获得无广告阅读体验、每周AI新闻简报、“AI雷达”前沿报告(每年6次)、评论访问权限以及我们完整的档案库。

无夸大报道的AI新闻——由人类精选。

超过20%的首发折扣。

无干扰阅读——无谷歌广告。

访问评论和社区讨论。

每周AI新闻简报。

每年6次:“AI雷达”——深入探讨关键AI话题。

KI Pro线上活动最高可享25%折扣。

访问我们完整的十年档案库。

获取The Decoder最新AI新闻。

热门故事

Luma AI的Uni-1可能是首个真正挑战谷歌Nano Banana图像主导地位的对手。

Anthropic泄露消息揭示了新模型“Claude Mythos”,其在测试中的得分远超以往任何模型。

据报道,OpenAI首席执行官山姆·阿尔特曼内部透露了一款“非常强大”的模型,能够“真正加速经济”。

OpenAI发布了一份提示指南,帮助设计师从GPT-5.4中获得更好的前端结果。

Meta收购Dreamer团队全部成员,以增强其落后的AI代理雄心。

不容错过的重点内容

紧跟AI动态。清晰、实用、无废话。

最受欢迎的内容

谷歌工程师表示,Claude Code在短短一小时内完成的工作,她的团队花了整整一年时间。

勒昆在离开Meta创办自己的初创公司时说:“你当然不会告诉像我这样的研究人员该做什么。”

前OpenAI研究员表示,当前AI模型无法从错误中学习,这成为通往通用人工智能(AGI)的障碍。

OpenClaw(原名Clawdbot)和Moltbook让攻击者能轻松穿过大门进入系统。

一项研究显示,一张打印标识牌就能劫持自动驾驶汽车并将其引向行人。

据报道,GPT-5.4带来了百万token上下文窗口和一种极端推理模式。

AI社区与洞察

The Decoder

关注The Decoder,获取AI新闻、背景故事和专家分析。

配图

Meta监督委员会:社区笔记无法应对AI虚假信息

Tag

来源与参考

  1. 原始链接
  2. Meta's own supervisory body warns that Community Notes are no match for AI disinformation