Anthropic 为 Claude 托管代理加入“Dreaming”

The Decoder··作者 Matthias Bastian

关键信息

Dreaming 以异步作业运行,会读取现有记忆库,并可选读取最多 100 个过往会话,清理重复和过期条目后生成新的有序记忆,同时保留原始记忆不变。Outcomes 使用独立评估器按开发者定义的标准打分,默认最多重试三轮,最多可达 20 次;多代理编排最多支持 20 个代理和 25 个同时运行的线程。

资讯摘要

Anthropic 正在扩展于 4 月推出的 Claude 托管代理平台,新增三项功能,目的是让代理在真实场景中更可靠、更具适应性。其中最引人注目的是“Dreaming”,它会回顾过去的代理会话,识别其中的模式,并把这些洞察反馈到代理的记忆中。Anthropic 表示,这样既能找出反复出现的错误,也能保留那些值得延续的有效工作流。技术上,Dreaming 以异步作业方式运行,会读取现有记忆库,并可选分析最多 100 个历史会话。随后它会去重并删除过期条目,在保留原始记忆不变的前提下,生成一份新的结构化记忆。Dreaming 目前支持 Claude Opus 4.7 和 Claude Sonnet 4.6,计费方式则按标准 API 令牌价格计算。

与此同时,Outcomes 和多代理编排正在从研究预览进入公开测试版。Outcomes 让开发者编写一份评分标准,用来定义“成功”应该是什么样子,而独立评估器会在自己的上下文窗口中检查代理输出,不会受到代理推理过程的影响。如果结果不符合要求,评估器会指出缺口,代理则可以重新修改,默认最多重试三次,最多可达 20 次。多代理编排则由一个协调器代理负责分配任务给多个专门子代理,每个子代理都有自己的上下文、模型、系统提示和工具,但共享同一个文件系统。Anthropic 表示,这种设计支持并行工作,例如让一个代理做代码审查、另一个代理同时编写测试,系统最多支持 20 个代理和 25 个并发线程。Dreaming 目前以研究预览形式开放申请,而 Outcomes、多代理编排和 Memory 则已作为公开测试版提供给 Managed Agents 平台用户。

Anthropic 为 Claude 托管代理加入“Dreaming”

资讯正文

Claude 的新“Dreaming”功能旨在让 AI 代理从错误中学习

Anthropic 正在扩展其于 4 月推出的 Claude Managed Agents 平台,新增三项功能,旨在让 AI 代理在真实世界使用中更可靠、更具适应性。

其中一项新功能是“Dreaming”,它会回顾过去的代理会话,识别模式,并在不同会话之间共享洞见,例如反复出现的错误或已验证有效的工作流程。

从技术上讲,Dreaming 以异步任务的形式运行:它会读取现有的记忆存储,并可选地读取最多 100 个过往会话,清理重复和过时条目,然后基于这些内容构建一个新的、整理过的记忆库。原始记忆会保持不变。目前支持 Claude Opus 4.7 和 Claude Sonnet 4.6,计费遵循标准 API 令牌定价。

Outcomes:独立评估器根据固定标准检查代理结果

Outcomes 和 Multiagent Orchestration 正从研究预览阶段进入公开 beta。借助 Outcomes,开发者可以定义一份评分标准(rubric):一份包含具体成功标准的文档,例如“CSV 文件包含一个带有数值的价格列。”

随后,一个独立的评估器(grader)会在自己的上下文窗口中,根据这些标准检查代理的输出,而不会受到代理推理过程的影响。如果结果不符合规范,评估器会指出差距,代理则会修正其工作,默认最多重试三次,最多可尝试 20 次。

Multiagent orchestration:协调器将工作分配给专门的子代理

在多代理编排中,一个主代理(协调器)负责管理多个专门代理的工作。每个代理都在各自独立的线程中运行,拥有隔离的上下文、自己的模型、系统提示和专用工具,但它们共享同一个文件系统。协调器可以并行分派任务,例如同时将代码审查和测试创建分别交给不同代理。该系统最多支持 20 个不同代理,并可同时运行最多 25 个线程。

Dreaming 目前以研究预览形式提供,开发者可以通过 Claude 网站上的表单申请访问。Outcomes、Multiagent Orchestration 和 Memory 作为 Anthropic Managed Agents 平台的一部分,现已提供公开 beta。更多细节可在文档、Claude 博客以及 Claude Console 中找到。

来源与参考

  1. 原始链接
  2. Claude's new "Dreaming" feature is designed to let AI agents learn from their mistakes

收录于 2026-05-08