Opus 4.7 每次请求使用更多 token,尽管定价相同
The Decoder··作者 Matthias Bastian
关键信息
Ray 的测试显示,代码生成的成本增幅最大(高达 30%),而散文和亚洲语言几乎无变化。性能提升微弱:Opus 4.7 在 IFEval 基准上指令遵循能力提高了 5 个百分点。
资讯摘要
尽管 Anthropic 采用统一定价策略,Opus 4.7 每次请求使用的 token 显著多于 Opus 4.6,导致用户成本上升。开发者 Abhishek Ray 使用不同语言和任务类型的现实使用模式进行了测量。对于一个 80 轮对话,成本从 6.65 美元上升到 7.86 至 8.76 美元——增加了 20–30%。
虽然 Opus 4.7 在指令遵循基准测试中表现稍好(提升了 5 个百分点),但这一微小改进无法为许多用户带来合理的成本补偿。这引发了关于 AI 提供商是否应披露 token 效率与定价信息的讨论。

资讯正文
首次令牌计数显示,尽管Anthropic采用统一定价,Opus 4.7的成本显著高于4.6
Anthropic的Opus 4.7与4.6标价相同,但每次请求消耗的令牌明显更多。这一结论来自开发者Abhishek Ray在Claude Code Camp上发布的测量数据。
Ray指出,代码类任务受影响最大,而散文类文本增加较少,中文和日文文本几乎不受影响。对于一个包含80轮对话的示例会话,他估计成本增加了20%至30%,使费用从6.65美元上升到7.86至8.76美元之间。
作为回报,用户获得略微更好的指令遵循能力:一项使用IFEval基准测试的实验显示,在20个提示中,Opus 4.7比前代模型更可靠地遵守严格指令,准确率高出五个百分点。
来源与参考
收录于 2026-04-20