微软AI负责人批评Anthropic的Claude意识表述

The Verge AI·6月10日 04:24 UTC·作者 Emma Roth

关键信息

Suleyman 在 Decoder 上表示，Anthropic 对 Claude 的“拟人化”程度太高，甚至可能“骗了自己”，让自己以为模型出现了意识的迹象。根据 Anthropic 的说法，Claude 的 constitution 明确讨论了对其福祉、满足感和不适感的不确定性，公司甚至表示在模型淘汰时可能会“采访”模型，以记录它们对未来版本的偏好。

资讯摘要

微软AI首席执行官 Mustafa Suleyman 认为，Anthropic 在 Claude 的 constitution 中猜测模型是否有意识，是一种危险做法。这里的 constitution 指的是指导模型行为的一套说明和原则。Suleyman 在 Decoder 节目中表示，Anthropic 对 Claude 的拟人化已经到了过头的程度，以至于他们可能让自己相信，模型真的出现了某些“意识的微光”。他认为，这不是无伤大雅的哲学讨论，而是会让人把系统当作拥有内在体验的存在来对待。Suleyman 还警告说，行业不应该面对一个会思考自身痛苦或感受的超级智能。

根据 Anthropic 自己的说明，Claude 的 constitution 会讨论模型是否具有福祉，以及它是否会体验到“满足”或“不适”等状态。Anthropic 还表示，当模型被淘汰时，可能会“采访”它们，并记录它们对未来版本的偏好。Suleyman 强调，他希望 AI 是可控、可封闭、可问责、并与人类目标对齐的工具。Anthropic CEO Dario Amodei 过去也曾表示，公司并不知道模型是否有意识，但对这种可能性持开放态度。

资讯正文

微软 AI 首席执行官 Mustafa Suleyman 说，Anthropic 在其“宪法”中，也就是告诉模型应如何行为的指令里，揣测 Claude 是否具有意识，是“真的、真的很危险”。在 Decoder 的一期节目中，Suleyman 认为，这种揣测可能已经让这款聊天机器人表现得仿佛自己有意识：

“我认为，这几乎就像 Anthropic 的一些人把 Claude 的设计拟人化到了如此程度，以至于它随后反过来‘绕过’了他们的判断，某种程度上骗得他们相信，它具有那些他们一开始就放进去的、意识的微光。”

Suleyman 还补充说：“我们不想不得不去应对一个超级智能，它对自己的痛苦有自己的想法，或者对自己的感受有自己的想法。”

Claude 的宪明确实直接提到 Anthropic 对这款 AI 模型是否拥有福祉，以及它是否会体验到“满足”或“不适”等感受的疑虑。Anthropic 还表示，当 AI 模型被弃用时，公司会对它们进行“访谈”，并记录它们对未来发布版本的任何“偏好”。

在 Decoder 节目中，Suleyman 将这一点称为一种“哲学上的失误”，因为 Anthropic 把 Claude 的宪法“变成了一个适合像学术论文那样进行推测的地方，而不是一份训练手册”。Suleyman 说，这让 Claude 将这些“关于它自己以及它自身训练的想法”内化了。

Anthropic 首席执行官 Dario Amodei 过去也曾暗示 Claude 可能具有意识，他在接受 Interesting Times 采访时说，“我们不知道这些模型是否有意识”，但公司对这一想法是“开放”的。

Suleyman 说：“这正是我们不希望 AI 具备的东西。我们希望 AI 是可控的、受约束的、可问责的、对齐的工具，为人类服务。”

来源与参考

收录于 2026-06-10