Claude Opus 4.8 强调诚实与可控推理力度

The Verge AI··作者 Jay Peters

关键信息

Anthropic 表示,早期测试者发现 Opus 4.8 更愿意承认不确定性;在公司的评估中,它让代码缺陷被忽略的概率约为上一代的 4 倍更低。新的努力程度控制允许用户为更高投入的回答消耗更多 token,而动态工作流则可以协调数百个并行子代理,并在返回结果前验证输出。

资讯摘要

Anthropic 将于周四推出 Claude Opus 4.8,并把这次更新的重点放在它所称的“诚实”能力上。公司表示,自己训练所有模型时都会要求它们避免给出无法支持的说法,但也承认通用的 AI 模型常会出现一个问题:它们会把证据不足的内容自信地包装成好像已经取得进展。Anthropic 认为,Opus 4.8 更擅长识别并表明不确定性,而不是假装自己知道得更多。公司称,早期测试者发现,这个模型更可能标注自己工作的不确定之处,也更不容易做出缺乏依据的断言。Anthropic 还表示,在内部评估中,Opus 4.8 让它自己编写的代码缺陷被忽略的概率,比上一代低大约 4 倍。

除了诚实性改进之外,这次发布还让用户可以控制 Claude 在任务上投入多少“努力”。更高努力等级的回答会使用更多 token,而较低努力等级则可以帮助用户不那么快耗尽速率限制。Anthropic 同时推出了名为“动态工作流”的研究预览功能,声称它可以通过先规划任务、再在单次会话中运行数百个并行子代理、最后在返回前验证输出,来处理更大的任务。公司还表示,在 Opus 4.8 上,这些代理可以运行更长时间,显示出其正在朝着更强的长链路自主任务执行能力推进。

Claude Opus 4.8 强调诚实与可控推理力度

资讯正文

Anthropic 将于周四发布 Claude Opus 4.8,该公司主打这款模型的“诚实”能力。

据 Anthropic 称,公司训练“所有模型都要诚实——例如,避免做出它们无法支持的断言”。但它指出,“AI 模型的一个普遍问题是,它们有时会过早下结论,尽管证据薄弱,却自信地把自己的工作呈现为已经取得进展。”

这家 AI 实验室称,早期测试者发现,Opus 4.8 “更有可能标记出其工作中的不确定性,也更不容易提出没有根据的说法。”在公司的评估中,Opus 4.8 “在让其所写代码中的缺陷不被指出这一点上,大约比前代模型低 4 倍的可能性。”

除了诚实方面的改进之外,使用 Opus 4.8 时,用户还可以指示 Claude 在某项任务上投入多少努力。更高努力的回复会使用更多 tokens,这也让用户在不想更快耗尽速率限制时,可以选择较低努力的回复。

Anthropic 还在研究预览中推出一项名为“动态工作流”(dynamic workflows)的功能。该公司表示,这将让 Claude “承担更大的任务”。借助动态工作流,“Claude 可以规划工作,然后在单个会话中运行数百个并行子代理(而在 Opus 4.8 中,这些代理还能运行更久)。随后,它会在向用户报告之前验证自己的输出。”

来源与参考

  1. 原始链接
  2. Claude’s new model is more ‘honest’ when it messes up

收录于 2026-05-29