Claude Opus 4.8 强调诚实与可控推理力度
The Verge AI··作者 Jay Peters
关键信息
Anthropic 表示,早期测试者发现 Opus 4.8 更愿意承认不确定性;在公司的评估中,它让代码缺陷被忽略的概率约为上一代的 4 倍更低。新的努力程度控制允许用户为更高投入的回答消耗更多 token,而动态工作流则可以协调数百个并行子代理,并在返回结果前验证输出。
资讯摘要
Anthropic 将于周四推出 Claude Opus 4.8,并把这次更新的重点放在它所称的“诚实”能力上。公司表示,自己训练所有模型时都会要求它们避免给出无法支持的说法,但也承认通用的 AI 模型常会出现一个问题:它们会把证据不足的内容自信地包装成好像已经取得进展。Anthropic 认为,Opus 4.8 更擅长识别并表明不确定性,而不是假装自己知道得更多。公司称,早期测试者发现,这个模型更可能标注自己工作的不确定之处,也更不容易做出缺乏依据的断言。Anthropic 还表示,在内部评估中,Opus 4.8 让它自己编写的代码缺陷被忽略的概率,比上一代低大约 4 倍。
除了诚实性改进之外,这次发布还让用户可以控制 Claude 在任务上投入多少“努力”。更高努力等级的回答会使用更多 token,而较低努力等级则可以帮助用户不那么快耗尽速率限制。Anthropic 同时推出了名为“动态工作流”的研究预览功能,声称它可以通过先规划任务、再在单次会话中运行数百个并行子代理、最后在返回前验证输出,来处理更大的任务。公司还表示,在 Opus 4.8 上,这些代理可以运行更长时间,显示出其正在朝着更强的长链路自主任务执行能力推进。

资讯正文
Anthropic 将于周四发布 Claude Opus 4.8,该公司主打这款模型的“诚实”能力。
据 Anthropic 称,公司训练“所有模型都要诚实——例如,避免做出它们无法支持的断言”。但它指出,“AI 模型的一个普遍问题是,它们有时会过早下结论,尽管证据薄弱,却自信地把自己的工作呈现为已经取得进展。”
这家 AI 实验室称,早期测试者发现,Opus 4.8 “更有可能标记出其工作中的不确定性,也更不容易提出没有根据的说法。”在公司的评估中,Opus 4.8 “在让其所写代码中的缺陷不被指出这一点上,大约比前代模型低 4 倍的可能性。”
除了诚实方面的改进之外,使用 Opus 4.8 时,用户还可以指示 Claude 在某项任务上投入多少努力。更高努力的回复会使用更多 tokens,这也让用户在不想更快耗尽速率限制时,可以选择较低努力的回复。
Anthropic 还在研究预览中推出一项名为“动态工作流”(dynamic workflows)的功能。该公司表示,这将让 Claude “承担更大的任务”。借助动态工作流,“Claude 可以规划工作,然后在单个会话中运行数百个并行子代理(而在 Opus 4.8 中,这些代理还能运行更久)。随后,它会在向用户报告之前验证自己的输出。”
来源与参考
收录于 2026-05-29