AI代理编排推动多代理工作流
MIT Technology Review AI··作者 Will Douglas Heaven
关键信息
编排涉及一个协调代理,负责分配角色并协调专业化代理之间的行动——例如编写、测试和修复代码。这些系统已被Nvidia、腾讯和Google DeepMind等公司用于实际应用。
资讯摘要
AI代理已从聊天机器人发展为能够执行复杂工作流的协同团队。像OpenClaw、Claude Code和Perplexity的Computer这样的工具允许用户将任务分派给具有特定角色的多个代理。例如,在编程中,一个代理编写代码,另一个进行测试——这种分工提高了效率。
这种方法现在正在扩展到普通专业人士的通用生产力工具,甚至通过Google DeepMind的Co-Scientist进入科学研究领域。其愿景是将多代理网络视为装配线,像亨利·福特改造制造业一样彻底改变知识型工作。然而,由于大语言模型在与现实世界系统交互时的不可预测性,风险依然存在。
资讯正文
当人们说人工智能将加速药物研发,或担心它会引发大规模裁员时,他们心中所想的——无论是否意识到——都是AI代理。ChatGPT让大型语言模型成为面向大众消费的产品,但要真正改变世界,人工智能不能只停留在对话层面,还需要能够执行具体任务。而这正是AI代理的作用所在。
如今,在经历了大量炒作之后,第一批真正意义上的多代理工具终于开始崭露头角。
OpenClaw——一种你可以通过手机与之对话的个人AI助手——吸引了众人的目光。在喧嚣之下,OpenClaw的功能有限,并且采用了破坏性的安全策略。但它让人感觉仿佛看到了未来。因此,从英伟达到腾讯等公司迅速基于OpenClaw的开源代码构建了更安全、更可靠的机器人。
但代理真正的力量在于它们可以协同工作。不同于单打独斗的机器人仅能完成单一任务(例如用浏览器预订餐厅或向你发送收件箱摘要),新的工具能够将多个代理组合起来,分配不同的任务,并协调它们的行为,使它们共同完成个体代理无法独立完成的复杂任务。
例如,Anthropic去年发布的Claude Code允许用户同时启动并协调多个编码代理(一些用户报告称同时运行多达几十个子代理),每个代理负责代码库的不同部分。代理还可以被赋予特定角色:一个编写代码,另一个测试代码,第三个修复错误,依此类推。这类工具有望让程序员转变为项目经理,让他们能够委托和监督远超自身能力范围的任务。
但编程只是起点。最新的多代理工具针对的是那些不需要也不愿开发软件的人群。像Anthropic的Claude Cowork(该公司声称仅用10天就用Claude Code完成了原本可能需要数月才能完成的项目)、OpenAI的Codex以及Perplexity的Computer这样的桌面应用,都被定位为面向白领专业人士的通用生产力工具。它们让你可以把定制化的流程交给一支由代理组成的团队来处理,这些代理能在各种计算机办公任务中协调合作,包括管理邮件、库存以及应对客户投诉等。
这不仅限于办公室工作。像谷歌DeepMind的Co-Scientist这样的多代理工具,能让研究人员利用AI代理团队来协调文献检索、生成和测试假设、设计实验等任务。
可以把多代理系统看作是新一代的流水线。亨利·福特当年的创新颠覆了整个产业。理论上,AI代理网络可能会对白领知识型工作产生的影响,正如流水线对制造业的影响一样深远。
这就是愿景。但这项技术也伴随着巨大的风险。众所周知,大型语言模型(LLMs)可能难以预测。当聊天机器人被困在屏幕内时,这只是一个麻烦;但如果它们开始更多地与现实世界互动,后果可能是灾难性的。我们是否已经准备好让智能体在无所不在的数字基础设施中自由行动——从医疗保健到金融,从社交媒体到导弹发射系统?
深入探讨
OpenAI正全力投入打造一个全自动的研究员
独家对话OpenAI首席科学家雅库布·帕霍茨基,他谈到了公司最新的重大挑战以及人工智能的未来。
《宝可梦GO》正在为配送机器人提供精确到厘米的世界视角
独家报道:Niantic的人工智能子公司正利用玩家贡献的300亿张城市地标图像,训练一种全新的世界模型。
保持联系
获取来自《麻省理工科技评论》的最新更新
发现特别优惠、热门新闻、即将举行的活动等内容。
来源与参考
收录于 2026-04-22