Anthropic 为 Claude 托管代理加入“Dreaming”

The Decoder·5月7日 18:59 UTC·作者 Matthias Bastian

关键信息

Dreaming 以异步作业运行，会读取现有记忆库，并可选读取最多 100 个过往会话，清理重复和过期条目后生成新的有序记忆，同时保留原始记忆不变。Outcomes 使用独立评估器按开发者定义的标准打分，默认最多重试三轮，最多可达 20 次；多代理编排最多支持 20 个代理和 25 个同时运行的线程。

资讯摘要

Anthropic 正在扩展于 4 月推出的 Claude 托管代理平台，新增三项功能，目的是让代理在真实场景中更可靠、更具适应性。其中最引人注目的是“Dreaming”，它会回顾过去的代理会话，识别其中的模式，并把这些洞察反馈到代理的记忆中。Anthropic 表示，这样既能找出反复出现的错误，也能保留那些值得延续的有效工作流。技术上，Dreaming 以异步作业方式运行，会读取现有记忆库，并可选分析最多 100 个历史会话。随后它会去重并删除过期条目，在保留原始记忆不变的前提下，生成一份新的结构化记忆。Dreaming 目前支持 Claude Opus 4.7 和 Claude Sonnet 4.6，计费方式则按标准 API 令牌价格计算。

与此同时，Outcomes 和多代理编排正在从研究预览进入公开测试版。Outcomes 让开发者编写一份评分标准，用来定义“成功”应该是什么样子，而独立评估器会在自己的上下文窗口中检查代理输出，不会受到代理推理过程的影响。如果结果不符合要求，评估器会指出缺口，代理则可以重新修改，默认最多重试三次，最多可达 20 次。多代理编排则由一个协调器代理负责分配任务给多个专门子代理，每个子代理都有自己的上下文、模型、系统提示和工具，但共享同一个文件系统。Anthropic 表示，这种设计支持并行工作，例如让一个代理做代码审查、另一个代理同时编写测试，系统最多支持 20 个代理和 25 个并发线程。Dreaming 目前以研究预览形式开放申请，而 Outcomes、多代理编排和 Memory 则已作为公开测试版提供给 Managed Agents 平台用户。

资讯正文

Claude 的新“Dreaming”功能旨在让 AI 代理从错误中学习

Anthropic 正在扩展其于 4 月推出的 Claude Managed Agents 平台，新增三项功能，旨在让 AI 代理在真实世界使用中更可靠、更具适应性。

其中一项新功能是“Dreaming”，它会回顾过去的代理会话，识别模式，并在不同会话之间共享洞见，例如反复出现的错误或已验证有效的工作流程。

从技术上讲，Dreaming 以异步任务的形式运行：它会读取现有的记忆存储，并可选地读取最多 100 个过往会话，清理重复和过时条目，然后基于这些内容构建一个新的、整理过的记忆库。原始记忆会保持不变。目前支持 Claude Opus 4.7 和 Claude Sonnet 4.6，计费遵循标准 API 令牌定价。

Outcomes：独立评估器根据固定标准检查代理结果

Outcomes 和 Multiagent Orchestration 正从研究预览阶段进入公开 beta。借助 Outcomes，开发者可以定义一份评分标准（rubric）：一份包含具体成功标准的文档，例如“CSV 文件包含一个带有数值的价格列。”

随后，一个独立的评估器（grader）会在自己的上下文窗口中，根据这些标准检查代理的输出，而不会受到代理推理过程的影响。如果结果不符合规范，评估器会指出差距，代理则会修正其工作，默认最多重试三次，最多可尝试 20 次。

Multiagent orchestration：协调器将工作分配给专门的子代理

在多代理编排中，一个主代理（协调器）负责管理多个专门代理的工作。每个代理都在各自独立的线程中运行，拥有隔离的上下文、自己的模型、系统提示和专用工具，但它们共享同一个文件系统。协调器可以并行分派任务，例如同时将代码审查和测试创建分别交给不同代理。该系统最多支持 20 个不同代理，并可同时运行最多 25 个线程。

Dreaming 目前以研究预览形式提供，开发者可以通过 Claude 网站上的表单申请访问。Outcomes、Multiagent Orchestration 和 Memory 作为 Anthropic Managed Agents 平台的一部分，现已提供公开 beta。更多细节可在文档、Claude 博客以及 Claude Console 中找到。

来源与参考

收录于 2026-05-08