Anthropic 为 Claude 托管代理加入“Dreaming”
The Decoder··作者 Matthias Bastian
关键信息
Dreaming 以异步作业运行,会读取现有记忆库,并可选读取最多 100 个过往会话,清理重复和过期条目后生成新的有序记忆,同时保留原始记忆不变。Outcomes 使用独立评估器按开发者定义的标准打分,默认最多重试三轮,最多可达 20 次;多代理编排最多支持 20 个代理和 25 个同时运行的线程。
资讯摘要
Anthropic 正在扩展于 4 月推出的 Claude 托管代理平台,新增三项功能,目的是让代理在真实场景中更可靠、更具适应性。其中最引人注目的是“Dreaming”,它会回顾过去的代理会话,识别其中的模式,并把这些洞察反馈到代理的记忆中。Anthropic 表示,这样既能找出反复出现的错误,也能保留那些值得延续的有效工作流。技术上,Dreaming 以异步作业方式运行,会读取现有记忆库,并可选分析最多 100 个历史会话。随后它会去重并删除过期条目,在保留原始记忆不变的前提下,生成一份新的结构化记忆。Dreaming 目前支持 Claude Opus 4.7 和 Claude Sonnet 4.6,计费方式则按标准 API 令牌价格计算。
与此同时,Outcomes 和多代理编排正在从研究预览进入公开测试版。Outcomes 让开发者编写一份评分标准,用来定义“成功”应该是什么样子,而独立评估器会在自己的上下文窗口中检查代理输出,不会受到代理推理过程的影响。如果结果不符合要求,评估器会指出缺口,代理则可以重新修改,默认最多重试三次,最多可达 20 次。多代理编排则由一个协调器代理负责分配任务给多个专门子代理,每个子代理都有自己的上下文、模型、系统提示和工具,但共享同一个文件系统。Anthropic 表示,这种设计支持并行工作,例如让一个代理做代码审查、另一个代理同时编写测试,系统最多支持 20 个代理和 25 个并发线程。Dreaming 目前以研究预览形式开放申请,而 Outcomes、多代理编排和 Memory 则已作为公开测试版提供给 Managed Agents 平台用户。

资讯正文
Claude 的新“Dreaming”功能旨在让 AI 代理从错误中学习
Anthropic 正在扩展其于 4 月推出的 Claude Managed Agents 平台,新增三项功能,旨在让 AI 代理在真实世界使用中更可靠、更具适应性。
其中一项新功能是“Dreaming”,它会回顾过去的代理会话,识别模式,并在不同会话之间共享洞见,例如反复出现的错误或已验证有效的工作流程。
从技术上讲,Dreaming 以异步任务的形式运行:它会读取现有的记忆存储,并可选地读取最多 100 个过往会话,清理重复和过时条目,然后基于这些内容构建一个新的、整理过的记忆库。原始记忆会保持不变。目前支持 Claude Opus 4.7 和 Claude Sonnet 4.6,计费遵循标准 API 令牌定价。
Outcomes:独立评估器根据固定标准检查代理结果
Outcomes 和 Multiagent Orchestration 正从研究预览阶段进入公开 beta。借助 Outcomes,开发者可以定义一份评分标准(rubric):一份包含具体成功标准的文档,例如“CSV 文件包含一个带有数值的价格列。”
随后,一个独立的评估器(grader)会在自己的上下文窗口中,根据这些标准检查代理的输出,而不会受到代理推理过程的影响。如果结果不符合规范,评估器会指出差距,代理则会修正其工作,默认最多重试三次,最多可尝试 20 次。
Multiagent orchestration:协调器将工作分配给专门的子代理
在多代理编排中,一个主代理(协调器)负责管理多个专门代理的工作。每个代理都在各自独立的线程中运行,拥有隔离的上下文、自己的模型、系统提示和专用工具,但它们共享同一个文件系统。协调器可以并行分派任务,例如同时将代码审查和测试创建分别交给不同代理。该系统最多支持 20 个不同代理,并可同时运行最多 25 个线程。
Dreaming 目前以研究预览形式提供,开发者可以通过 Claude 网站上的表单申请访问。Outcomes、Multiagent Orchestration 和 Memory 作为 Anthropic Managed Agents 平台的一部分,现已提供公开 beta。更多细节可在文档、Claude 博客以及 Claude Console 中找到。
来源与参考
收录于 2026-05-08