Claude Opus 4.8 强调诚实与可控推理力度

The Verge AI·5月29日 01:00 UTC·作者 Jay Peters

关键信息

Anthropic 表示，早期测试者发现 Opus 4.8 更愿意承认不确定性；在公司的评估中，它让代码缺陷被忽略的概率约为上一代的 4 倍更低。新的努力程度控制允许用户为更高投入的回答消耗更多 token，而动态工作流则可以协调数百个并行子代理，并在返回结果前验证输出。

资讯摘要

Anthropic 将于周四推出 Claude Opus 4.8，并把这次更新的重点放在它所称的“诚实”能力上。公司表示，自己训练所有模型时都会要求它们避免给出无法支持的说法，但也承认通用的 AI 模型常会出现一个问题：它们会把证据不足的内容自信地包装成好像已经取得进展。Anthropic 认为，Opus 4.8 更擅长识别并表明不确定性，而不是假装自己知道得更多。公司称，早期测试者发现，这个模型更可能标注自己工作的不确定之处，也更不容易做出缺乏依据的断言。Anthropic 还表示，在内部评估中，Opus 4.8 让它自己编写的代码缺陷被忽略的概率，比上一代低大约 4 倍。

除了诚实性改进之外，这次发布还让用户可以控制 Claude 在任务上投入多少“努力”。更高努力等级的回答会使用更多 token，而较低努力等级则可以帮助用户不那么快耗尽速率限制。Anthropic 同时推出了名为“动态工作流”的研究预览功能，声称它可以通过先规划任务、再在单次会话中运行数百个并行子代理、最后在返回前验证输出，来处理更大的任务。公司还表示，在 Opus 4.8 上，这些代理可以运行更长时间，显示出其正在朝着更强的长链路自主任务执行能力推进。

资讯正文

Anthropic 将于周四发布 Claude Opus 4.8，该公司主打这款模型的“诚实”能力。

据 Anthropic 称，公司训练“所有模型都要诚实——例如，避免做出它们无法支持的断言”。但它指出，“AI 模型的一个普遍问题是，它们有时会过早下结论，尽管证据薄弱，却自信地把自己的工作呈现为已经取得进展。”

这家 AI 实验室称，早期测试者发现，Opus 4.8 “更有可能标记出其工作中的不确定性，也更不容易提出没有根据的说法。”在公司的评估中，Opus 4.8 “在让其所写代码中的缺陷不被指出这一点上，大约比前代模型低 4 倍的可能性。”

除了诚实方面的改进之外，使用 Opus 4.8 时，用户还可以指示 Claude 在某项任务上投入多少努力。更高努力的回复会使用更多 tokens，这也让用户在不想更快耗尽速率限制时，可以选择较低努力的回复。

Anthropic 还在研究预览中推出一项名为“动态工作流”（dynamic workflows）的功能。该公司表示，这将让 Claude “承担更大的任务”。借助动态工作流，“Claude 可以规划工作，然后在单个会话中运行数百个并行子代理（而在 Opus 4.8 中，这些代理还能运行更久）。随后，它会在向用户报告之前验证自己的输出。”

来源与参考

收录于 2026-05-29