Anthropic 发布 Opus 4.8 和动态工作流

TechCrunch AI·5月29日 01:00 UTC·作者 Russell Brandom

关键信息

Anthropic 表示，早期测试者发现 Opus 4.8 更愿意提示自身的不确定性，也更不容易做出缺乏依据的断言。公司还称，结合 Opus 4.8 的 Claude Code 可以处理规模达到数十万行代码的代码库迁移，而 Dynamic Workflows 目前仍处于研究预览阶段。

资讯摘要

Anthropic 周四宣布发布 Opus 4.8，这是其目前最先进、面向公众可用的模型的最新版本。该模型已在各处上线，标准定价与上一代 Opus 保持不变。值得注意的是，Opus 4.8 距离 Opus 4.7 的发布时间只有 41 天，这比 Anthropic 平时的升级节奏快得多。这样的速度可能与 Opus 4.7 受到的反响偏冷有关，一些用户认为它令人失望。与此同时，OpenAI 的 Codex 和 Google 的 Gemini Flash 也在这一时间段内相继更新，进一步加大了 Anthropic 追赶竞争对手的压力。Anthropic 表示，Opus 4.8 依然带来了符合预期的一流基准成绩，但公司更强调的是它在不确定性和脏数据处理上的改进。

根据发布说明，早期测试者发现，新模型更容易主动标记自己工作中的不确定之处，也更不容易做出缺乏依据的断言。Bridgewater 的一段评价也呼应了这一点，称 Opus 4.8 最大的变化是会主动指出分析输入和输出中的问题，而这些问题往往是其他模型会漏掉、留给用户自己发现的。除了新模型，Anthropic 还发布了 Dynamic Workflows，这是一项研究预览功能，旨在帮助更大型的模型协调数百个并行子代理处理复杂任务。公司表示，结合 Opus 4.8 的 Claude Code 现在可以从启动到合并，完成跨越数十万行代码的代码库级迁移，并以现有测试套件作为质量标准。Anthropic 目前仍在暂缓推出其更先进的 Mythos 模型，因为上个月的初步预览引发了网络安全方面的担忧，但公司暗示，只要必要的安全防护完成，Mythos 预览期可能很快结束。

资讯正文

周四，Anthropic 发布了 Opus 4.8，这是其目前公开可用的最强大模型的最新版本。该模型已在各处上线，标准定价与上一代 Opus 保持一致。

这款新模型距离 Opus 4.7 发布仅过去了 41 天，这对 Anthropic 来说是比平时快得多的升级节奏。（最新的 Sonnet 和 Haiku 模型分别已经发布三个月和七个月。）如此迅速的迭代，或许与 Opus 4.7 遇到的冷淡反响有关，一些用户认为它令人失望。

在这段时间里，OpenAI 的 Codex 和 Google 的 Gemini Flash 模型也都有了重要新发布，这进一步加大了 Anthropic 保持步伐的压力。

Opus 4.8 依然带来了符合预期的业界领先基准测试成绩，但外界也特别关注该模型如何处理错误或不确定的数据。在发布文章中，Anthropic 的早期测试者发现，新模型“更有可能标记其工作中的不确定性，也更不容易做出没有依据的断言”。

呼应这一点，Bridgewater 员工的一段评价称，此次升级最大的不同在于“Opus 4.8 倾向于主动标记分析输入和输出中的问题，而其他模型通常会忽略这些问题，留给用户自己去发现”。

与新模型一同发布的，还有 Anthropic 推出的一项名为 Dynamic Workflows 的功能，该功能将以研究预览版的形式提供。该系统旨在帮助像 Opus 这样的更大型模型在数百个并行子代理之间管理复杂任务。

该文章解释说：“Claude Code 结合 Opus 4.8，现在可以从启动到合并，执行覆盖数十万行代码的代码库级迁移，并以现有测试套件作为其衡量标准。”

Anthropic 仍然暂缓推出其最先进的 Mythos 模型，上个月一次试探性预览曾引发网络安全方面的担忧。不过，公司在今天的 Opus 发布中暗示，一旦必要的防护措施完成，Mythos 的预览期可能很快就会结束。

公司写道：“我们在开发这些防护措施方面正迅速取得进展，并预计在未来几周内将 Mythos 级别的模型带给我们所有客户。”

6种让“成年生活”更轻松的厨房小工具

我试用了亚马逊的Bee可穿戴设备，既感到好奇，也有点毛骨悚然

你已经不能再用Google搜索“disregard”这个词了

来源与参考

收录于 2026-05-29