Cloudflare启动Agents Week,重新定义AI时代的互联网基础设施
Cloudflare AI··作者 Dane Knecht
关键信息
每个用户一个代理需要持久化、隔离的环境,而不仅仅是临时容器;仅美国知识工作者在15%并发下就可能需要50万到100万个服务器CPU。Cloudflare的Workers平台基于V8隔离而非容器,被认为是这一新模式的潜在基础。
资讯摘要
Cloudflare正在启动Agents Week,以应对互联网必须如何演进才能支持AI驱动的代理——这些是独特且任务特定的实例,与传统应用有根本不同。不同于微服务从单一代码路径服务多个用户,代理是一对一:每个都有自己的执行环境、工具和持久性。
公司指出,全球范围内扩展代理可能需要数百万台服务器CPU,远超当今容量。他们主张现有基础设施如Kubernetes和容器无法满足需求;相反,他们提倡像Workers这样的轻量级无服务器计算,避免冷启动并实现高效代理部署。

资讯正文
欢迎来到代理周
Cloudflare 的使命始终是帮助构建更美好的互联网。有时这意味着为当下存在的互联网而打造,有时则意味着为即将来临的互联网而打造。
今天,我们正式启动代理周,专注于为未来打造互联网。
互联网并非为人工智能时代而设计,云服务也是如此。
我们所熟知的云服务,是上一次重大技术范式转变的结果:智能手机。
当智能手机将互联网装进口袋时,它们不仅增加了用户数量,还改变了‘在线’的含义。始终联网、随时期待即时响应。应用程序必须应对数量级更高的用户,支撑它们的基础设施也必须随之演进。
业界最终采用的方法很简单:更多用户,就复制更多应用实例。随着应用复杂度提升,团队将其拆分为更小的部分——微服务,以便每个团队都能掌控自己的命运。但核心原则保持不变:有限数量的应用程序,每个服务大量用户。扩展意味着增加副本数量。
Kubernetes 和容器因此成为默认选择。它们让启动实例、负载均衡和销毁无用资源变得简单。在这种一对多模式下,一个实例可以服务多个用户,即便用户数量增长到数十亿,你所需要管理的对象数量依然有限。
代理打破了这种模式。
一人一代理,一任务
与之前的所有应用程序不同,代理是一对一的关系。每个代理都是独一无二的实例,只为一位用户服务,执行一项任务。传统应用程序无论谁在使用,都遵循相同的执行路径;而代理需要独立的执行环境:一个由大语言模型(LLM)决定代码路径、动态调用工具、调整策略,并持续运行直到任务完成的环境。
你可以把它理解为餐厅和私人厨师的区别。餐厅有固定菜单,厨房专门优化批量制作这些菜品。这正是当今大多数应用程序的样子。代理更像是私人厨师,会问:你想吃什么?每次可能都需要完全不同的食材、厨具或烹饪技巧。你无法用经营餐厅的厨房来运营私人厨师的服务。
在过去一年里,我们看到代理开始兴起,其中编程代理走在前列——这并不意外,因为开发者往往是早期采用者。目前大多数编程代理的做法是启动一个容器,为大语言模型提供所需环境:文件系统、Git、bash,以及运行任意二进制文件的能力。
但编程代理只是起点。像 Claude Cowork 这样的工具已经让非技术人员也能轻松使用代理。一旦代理从开发者走向大众——行政助理、研究分析师、客服人员、个人规划师——规模计算就会迅速变得令人清醒。
面向大众扩展代理的规模计算
欢迎来到代理周
如果美国超过一亿的知识工作者每人同时使用一个代理助手,且并发率为15%,那么你需要支持大约2400万个并行会话。按照每台CPU支持25到50个用户计算,这相当于需要50万到100万台服务器CPU——仅限美国,且每人一个代理。
现在想象每个人同时运行多个代理。再想象全球有超过十亿的知识工作者。我们不是稍微缺乏算力,而是差了好几个数量级。
那么,我们该如何缩小这个差距?
为代理构建基础设施
八年前,我们推出了Workers——这是我们开发者平台的起点,也是对无容器、无服务器计算的一次押注。当时的主要动机很实际:我们需要轻量级计算能力,且没有冷启动问题,因为依赖Cloudflare来实现速度的客户对此有强烈需求。Workers基于V8隔离环境而非传统容器构建,结果证明其效率高出一个数量级——启动更快、运行更便宜,并天然适合“启动、执行、销毁”的模式。
我们没想到的是,这种模型竟然如此契合代理时代的需求。
容器给每个代理提供了一个完整的商用厨房:固定设备、大型冰箱等全套设施,无论代理是否真的需要;而隔离环境则像一位私人厨师,只提供完成这顿饭所需的灶台、炉子和刀具。它们在几毫秒内就能分配完毕,在菜品上桌后立刻清理干净。
在一个需要支持数以亿计短暂、单一用途执行环境的世界里,隔离环境才是正确的基础构件。
每个隔离环境可以在几毫秒内启动,每个都安全地沙箱化运行,而且你能在相同硬件上运行比容器多出好几个数量级的数量。
就在几周前,我们通过动态Workers公开测试版进一步推进了这一方向:运行时按需创建执行环境。一个隔离环境只需几毫秒即可启动,占用几兆字节内存。这大约比容器快100倍,内存效率最高提升100倍。
你可以为每一个请求启动一个新的隔离环境,运行一小段代码,然后立即丢弃——每秒可达到百万级别的规模。
为了让代理从早期采用者走向大众用户,它们也必须变得经济实惠。如今将每个代理单独放在容器中运行的成本过高,导致代理工具主要局限于工程师群体——他们能承担得起费用。而隔离环境由于运行效率高出好几个数量级,使得代理所需的规模化单位成本变得可行。
无马车阶段
虽然建立面向未来的正确基础至关重要,但我们尚未到达那个阶段。每一次范式转变都会经历一个尝试用旧模型让新事物运转的时期。最早的汽车被称为‘无马车辆’,最早的网站是数字版宣传册,最早的移动应用只是桌面界面的缩小版。我们现在正处于这样的阶段,面对代理也是如此。
你可以在各个地方看到这种现象。
欢迎来到代理周
我们正在给代理使用无头浏览器来浏览为人类设计的网站,而它们真正需要的是像MCP这样的结构化协议,以直接发现和调用服务。
许多早期的MCP服务器只是现有REST API的简单封装——相同的CRUD操作,新的协议——但大语言模型(LLM)实际上更擅长编写代码,而不是进行顺序工具调用。
我们使用验证码(CAPTCHA)和行为指纹识别来验证请求另一端的对象,但越来越多情况下,这个对象是一个代表他人行动的代理。此时正确的提问不是“你是不是人类?”,而是“你是哪个代理?谁授权了你?你被允许做什么?”
我们正在为只需要做几次API调用并返回结果的代理启动完整的容器环境。
这只是几个例子,但这些都不令人意外。这正是技术过渡期的样子。
兼顾当下与未来
互联网总是处于两个时代的夹缝之中。IPv6在客观上优于IPv4,但放弃IPv4支持会破坏一半的互联网。HTTP/2和HTTP/3共存,TLS 1.2仍未完全被TLS 1.3取代。新技术存在时,旧技术依然延续,基础设施的任务就是弥合两者之间的鸿沟。
Cloudflare一直致力于弥合这类过渡。向代理迁移也不例外。
编码代理确实需要容器——文件系统、Git、bash、任意二进制执行能力——这一点不会改变。本周,我们的基于容器的沙箱环境正式上线(GA),因为我们致力于将其做到最好。我们还会进一步深化对代理的浏览器渲染支持,因为仍有许多服务尚未采用MCP协议,代理仍需与其交互。这些不是权宜之计,而是完整平台的一部分。
但我们也在构建未来:即代理真正需要的隔离机制、协议和身份模型。我们的职责是确保你无需在今天可用的东西和明天应该有的东西之间做出选择。
安全应嵌入模型,而非附加于外
如果代理要处理我们的专业和个人任务——阅读邮件、操作代码、与金融业务互动——那么安全必须内建于执行模型中,而不是事后叠加。
首席信息安全官(CISO)最先面临这一挑战。将代理部署到每个人手中带来的生产力提升是真实的,但目前大多数代理部署都充满风险:提示注入、数据泄露、未经授权的API访问、工具使用不透明。
开发者的“氛围编程”代理需要访问仓库和部署流水线;企业的客户服务代理则需要访问内部API和用户数据。在这两种情况下,今天的环境安全意味着拼凑原本从未为自主软件设计过的凭证、网络策略和访问控制机制。
Cloudflare一直在并行建设两个平台:面向开发者的平台,供应用程序开发者使用;以及零信任平台,供需要保障访问安全的企业组织使用。一段时间以来,这两个平台服务于不同的受众。
欢迎来到代理周
但“我该如何构建这个代理?”和“我如何确保它的安全?”这两个问题正变得越来越相似。我们正在将这些平台整合在一起,使这一切成为代理运行方式的原生部分,而不是一个需要额外添加的独立层。
遵循规则的代理
代理时代还有另一个维度,超越了计算能力和安全性:经济和治理。
当代理代表我们在互联网上行动——阅读文章、调用API、访问服务时——必须有一种方式让内容创作者和服务提供者设定条款并获得报酬。目前,网络的经济模型围绕人类注意力构建:广告、付费墙、订阅。
代理没有注意力(至少不是那种注意力)。它们不会看到广告,也不会点击Cookie提示框。
如果我们希望有一个代理可以自由运行的互联网,并且出版商、内容创作者和服务提供商能得到公平补偿,我们就需要为此建立新的基础设施。我们正在打造工具,让出版商和内容所有者能够轻松设置并执行有关代理如何与其内容交互的政策。
打造更好的互联网始终意味着确保它对每个人都有用——不仅是技术的建造者,还有那些以工作和创造力让互联网值得使用的人们。这一点在代理时代不会改变,反而变得更加重要。
我们对开发者平台的愿景一直是提供一个全面且能正常运作的平台:从实验阶段,到最小可行产品(MVP),再到扩展到数百万用户。但提供基础能力只是其中一部分;一个优秀的平台还必须考虑所有组件如何协同工作,以及如何融入你的开发流程。
这项任务正在演变。过去,这纯粹关乎开发者体验,即让人更容易地构建、测试和发布软件。如今,它也越来越关乎帮助代理协助人类,让平台不仅服务于代理的建造者,也服务于代理本身。代理能否找到最新的最佳实践?它能否轻松发现并调用所需的工具和命令行界面(CLI)?从编写代码到部署的过程能否无缝衔接?
本周,我们在两个维度都推出了改进——让Cloudflare对构建应用的人类开发者更好用,同时也让在其上运行的代理更高效。
面向未来的建设是一场团队运动
面向未来的建设不可能由我们单独完成。从HTTP/1.1到HTTP/2和HTTP/3,从TLS 1.2到TLS 1.3的每一次重大互联网转型,都需要整个行业达成共识,采用共同标准。向代理的转变也是如此。
Cloudflare长期以来一直积极参与推动使互联网运转的标准制定。我们十多年以来深度参与IETF(互联网工程任务组),帮助开发和部署QUIC、TLS 1.3和加密客户端问候等协议。我们是WinterTC的创始成员,这是ECMA的技术委员会,致力于JavaScript运行时的互操作性。我们甚至开源了Workers运行时本身,因为我们相信底层基础应当开放。
欢迎来到代理周
我们正在将同样的方法带入代理时代。我们很高兴成为Linux基金会和AAIF的一员,助力推动MCP等基础性标准的发展,这些标准将成为代理未来的关键。
自Anthropic推出MCP以来,我们一直与他们密切合作,构建远程MCP服务器的基础设施,开源了我们自己的实现方案,并投入资源使该协议能够在大规模场景中落地实用。
去年,我们与Coinbase共同创立了x402基金会,这是一个开放且中立的标准,重新启用长期未被使用的HTTP 402状态码,为代理提供一种原生支付方式,用于购买其所消耗的服务和内容。
代理身份、授权、支付、安全:所有这些都需要开放的标准,而任何单一公司都无法独自定义。
敬请期待
本周,我们将从代理栈的每个维度发布重要消息:计算、连接性、安全性、身份认证、经济模型以及开发者体验。
互联网并非为AI而建,云服务也非为代理而设。但Cloudflare始终致力于帮助打造更美好的互联网——而“更好”的含义随着每个时代不断演进。现在正是代理的时代。本周,请持续关注,我们将向你展示为此所做的建设。
来源与参考
收录于 2026-04-13