Anthropic 发布 Opus 4.8 和动态工作流
TechCrunch AI··作者 Russell Brandom
关键信息
Anthropic 表示,早期测试者发现 Opus 4.8 更愿意提示自身的不确定性,也更不容易做出缺乏依据的断言。公司还称,结合 Opus 4.8 的 Claude Code 可以处理规模达到数十万行代码的代码库迁移,而 Dynamic Workflows 目前仍处于研究预览阶段。
资讯摘要
Anthropic 周四宣布发布 Opus 4.8,这是其目前最先进、面向公众可用的模型的最新版本。该模型已在各处上线,标准定价与上一代 Opus 保持不变。值得注意的是,Opus 4.8 距离 Opus 4.7 的发布时间只有 41 天,这比 Anthropic 平时的升级节奏快得多。这样的速度可能与 Opus 4.7 受到的反响偏冷有关,一些用户认为它令人失望。与此同时,OpenAI 的 Codex 和 Google 的 Gemini Flash 也在这一时间段内相继更新,进一步加大了 Anthropic 追赶竞争对手的压力。Anthropic 表示,Opus 4.8 依然带来了符合预期的一流基准成绩,但公司更强调的是它在不确定性和脏数据处理上的改进。
根据发布说明,早期测试者发现,新模型更容易主动标记自己工作中的不确定之处,也更不容易做出缺乏依据的断言。Bridgewater 的一段评价也呼应了这一点,称 Opus 4.8 最大的变化是会主动指出分析输入和输出中的问题,而这些问题往往是其他模型会漏掉、留给用户自己发现的。除了新模型,Anthropic 还发布了 Dynamic Workflows,这是一项研究预览功能,旨在帮助更大型的模型协调数百个并行子代理处理复杂任务。公司表示,结合 Opus 4.8 的 Claude Code 现在可以从启动到合并,完成跨越数十万行代码的代码库级迁移,并以现有测试套件作为质量标准。Anthropic 目前仍在暂缓推出其更先进的 Mythos 模型,因为上个月的初步预览引发了网络安全方面的担忧,但公司暗示,只要必要的安全防护完成,Mythos 预览期可能很快结束。

资讯正文
周四,Anthropic 发布了 Opus 4.8,这是其目前公开可用的最强大模型的最新版本。该模型已在各处上线,标准定价与上一代 Opus 保持一致。
这款新模型距离 Opus 4.7 发布仅过去了 41 天,这对 Anthropic 来说是比平时快得多的升级节奏。(最新的 Sonnet 和 Haiku 模型分别已经发布三个月和七个月。)如此迅速的迭代,或许与 Opus 4.7 遇到的冷淡反响有关,一些用户认为它令人失望。
在这段时间里,OpenAI 的 Codex 和 Google 的 Gemini Flash 模型也都有了重要新发布,这进一步加大了 Anthropic 保持步伐的压力。
Opus 4.8 依然带来了符合预期的业界领先基准测试成绩,但外界也特别关注该模型如何处理错误或不确定的数据。在发布文章中,Anthropic 的早期测试者发现,新模型“更有可能标记其工作中的不确定性,也更不容易做出没有依据的断言”。
呼应这一点,Bridgewater 员工的一段评价称,此次升级最大的不同在于“Opus 4.8 倾向于主动标记分析输入和输出中的问题,而其他模型通常会忽略这些问题,留给用户自己去发现”。
与新模型一同发布的,还有 Anthropic 推出的一项名为 Dynamic Workflows 的功能,该功能将以研究预览版的形式提供。该系统旨在帮助像 Opus 这样的更大型模型在数百个并行子代理之间管理复杂任务。
该文章解释说:“Claude Code 结合 Opus 4.8,现在可以从启动到合并,执行覆盖数十万行代码的代码库级迁移,并以现有测试套件作为其衡量标准。”
Anthropic 仍然暂缓推出其最先进的 Mythos 模型,上个月一次试探性预览曾引发网络安全方面的担忧。不过,公司在今天的 Opus 发布中暗示,一旦必要的防护措施完成,Mythos 的预览期可能很快就会结束。
公司写道:“我们在开发这些防护措施方面正迅速取得进展,并预计在未来几周内将 Mythos 级别的模型带给我们所有客户。”
6种让“成年生活”更轻松的厨房小工具
我试用了亚马逊的Bee可穿戴设备,既感到好奇,也有点毛骨悚然
你已经不能再用Google搜索“disregard”这个词了
来源与参考
收录于 2026-05-29