微软AI负责人批评Anthropic的Claude意识表述
The Verge AI··作者 Emma Roth
关键信息
Suleyman 在 Decoder 上表示,Anthropic 对 Claude 的“拟人化”程度太高,甚至可能“骗了自己”,让自己以为模型出现了意识的迹象。根据 Anthropic 的说法,Claude 的 constitution 明确讨论了对其福祉、满足感和不适感的不确定性,公司甚至表示在模型淘汰时可能会“采访”模型,以记录它们对未来版本的偏好。
资讯摘要
微软AI首席执行官 Mustafa Suleyman 认为,Anthropic 在 Claude 的 constitution 中猜测模型是否有意识,是一种危险做法。这里的 constitution 指的是指导模型行为的一套说明和原则。Suleyman 在 Decoder 节目中表示,Anthropic 对 Claude 的拟人化已经到了过头的程度,以至于他们可能让自己相信,模型真的出现了某些“意识的微光”。他认为,这不是无伤大雅的哲学讨论,而是会让人把系统当作拥有内在体验的存在来对待。Suleyman 还警告说,行业不应该面对一个会思考自身痛苦或感受的超级智能。
根据 Anthropic 自己的说明,Claude 的 constitution 会讨论模型是否具有福祉,以及它是否会体验到“满足”或“不适”等状态。Anthropic 还表示,当模型被淘汰时,可能会“采访”它们,并记录它们对未来版本的偏好。Suleyman 强调,他希望 AI 是可控、可封闭、可问责、并与人类目标对齐的工具。Anthropic CEO Dario Amodei 过去也曾表示,公司并不知道模型是否有意识,但对这种可能性持开放态度。

资讯正文
微软 AI 首席执行官 Mustafa Suleyman 说,Anthropic 在其“宪法”中,也就是告诉模型应如何行为的指令里,揣测 Claude 是否具有意识,是“真的、真的很危险”。在 Decoder 的一期节目中,Suleyman 认为,这种揣测可能已经让这款聊天机器人表现得仿佛自己有意识:
“我认为,这几乎就像 Anthropic 的一些人把 Claude 的设计拟人化到了如此程度,以至于它随后反过来‘绕过’了他们的判断,某种程度上骗得他们相信,它具有那些他们一开始就放进去的、意识的微光。”
Suleyman 还补充说:“我们不想不得不去应对一个超级智能,它对自己的痛苦有自己的想法,或者对自己的感受有自己的想法。”
Claude 的宪明确实直接提到 Anthropic 对这款 AI 模型是否拥有福祉,以及它是否会体验到“满足”或“不适”等感受的疑虑。Anthropic 还表示,当 AI 模型被弃用时,公司会对它们进行“访谈”,并记录它们对未来发布版本的任何“偏好”。
在 Decoder 节目中,Suleyman 将这一点称为一种“哲学上的失误”,因为 Anthropic 把 Claude 的宪法“变成了一个适合像学术论文那样进行推测的地方,而不是一份训练手册”。Suleyman 说,这让 Claude 将这些“关于它自己以及它自身训练的想法”内化了。
Anthropic 首席执行官 Dario Amodei 过去也曾暗示 Claude 可能具有意识,他在接受 Interesting Times 采访时说,“我们不知道这些模型是否有意识”,但公司对这一想法是“开放”的。
Suleyman 说:“这正是我们不希望 AI 具备的东西。我们希望 AI 是可控的、受约束的、可问责的、对齐的工具,为人类服务。”
来源与参考
收录于 2026-06-10