Claude新增“Dreaming”提升智能体记忆与可靠性
The Decoder··作者 Matthias Bastian
关键信息
Dreaming 以异步任务运行,会读取现有记忆库,并可选地分析最多 100 个历史会话,然后生成经过清理和重组的新记忆。Anthropic 表示原始记忆会保持不变,目前支持 Claude Opus 4.7 和 Claude Sonnet 4.6,计费方式按标准 API 令牌价格计算。
资讯摘要
Anthropic 正在扩展其 Claude Managed Agents 平台,该平台于 4 月推出,这次新增了三个功能,目标是提升智能体在真实场景中的可靠性和适应性。其中最引人注目的是 Dreaming,它会回顾之前的智能体会话,找出单次运行不容易察觉的模式。Anthropic 表示,Dreaming 能够发现反复出现的错误、常见工作流程,甚至是团队成员共享的偏好。 从技术上看,Dreaming 以异步任务运行,会读取已有的记忆库,并可选分析最多 100 个历史会话。随后它会去除重复和过时的条目,生成一个更有组织的记忆层。Anthropic 还表示,原始记忆会被保留,而不是被覆盖。Dreaming 目前处于研究预览阶段,开发者可以通过 Claude 网站上的表单申请访问。
该功能目前支持 Claude Opus 4.7 和 Claude Sonnet 4.6,计费方式按标准 API 令牌用量计算。 此外,Outcomes 和 Multiagent Orchestration 也从研究预览转为公开测试版。Outcomes 允许开发者通过 rubric 定义明确的成功标准,而一个独立的评估器会在自己的上下文窗口中检查智能体输出,避免被智能体的推理过程影响。如果结果不符合要求,评估器会指出缺口,并促使智能体修改结果,默认最多重试 3 次,最高可达 20 次。Multiagent Orchestration 则允许一个协调智能体把任务分派给多个专门子智能体,每个子智能体都有独立上下文、自己的模型、系统提示和工具,但它们共享同一个文件系统。该系统最多支持 20 个智能体和 25 个并发线程,适合并行执行代码审查和测试创建等任务。

资讯正文
Claude 的新“Dreaming”功能旨在让 AI 代理从错误中学习
Anthropic 正在扩展其于 4 月推出的 Claude Managed Agents 平台,新增三项功能,旨在让 AI 代理在真实世界使用中更可靠、更具适应性。
其中一项新功能是“Dreaming”,它会回顾过去的代理会话,识别模式,并在不同会话之间共享洞见,例如反复出现的错误或已验证有效的工作流程。
从技术上讲,Dreaming 以异步任务的形式运行:它会读取现有的记忆存储,并可选地读取最多 100 个过往会话,清理重复和过时条目,然后基于这些内容构建一个新的、整理过的记忆库。原始记忆会保持不变。目前支持 Claude Opus 4.7 和 Claude Sonnet 4.6,计费遵循标准 API 令牌定价。
Outcomes:独立评估器根据固定标准检查代理结果
Outcomes 和 Multiagent Orchestration 正从研究预览阶段进入公开 beta。借助 Outcomes,开发者可以定义一份评分标准(rubric):一份包含具体成功标准的文档,例如“CSV 文件包含一个带有数值的价格列。”
随后,一个独立的评估器(grader)会在自己的上下文窗口中,根据这些标准检查代理的输出,而不会受到代理推理过程的影响。如果结果不符合规范,评估器会指出差距,代理则会修正其工作,默认最多重试三次,最多可尝试 20 次。
Multiagent orchestration:协调器将工作分配给专门的子代理
在多代理编排中,一个主代理(协调器)负责管理多个专门代理的工作。每个代理都在各自独立的线程中运行,拥有隔离的上下文、自己的模型、系统提示和专用工具,但它们共享同一个文件系统。协调器可以并行分派任务,例如同时将代码审查和测试创建分别交给不同代理。该系统最多支持 20 个不同代理,并可同时运行最多 25 个线程。
Dreaming 目前以研究预览形式提供,开发者可以通过 Claude 网站上的表单申请访问。Outcomes、Multiagent Orchestration 和 Memory 作为 Anthropic Managed Agents 平台的一部分,现已提供公开 beta。更多细节可在文档、Claude 博客以及 Claude Console 中找到。
来源与参考