AWS 将 OpenSearch 重建为面向 AI 代理

TechCrunch AI··作者 Rebecca Bellan

关键信息

AWS 表示,这次升级将计算与存储解耦,这正是实现自动缩减到零和更快应对突发流量的关键。发布时,OpenSearch Serverless 还可与 Vercel 和 Kiro 等 AI 开发平台原生集成,为生产环境提供搜索和向量后端。

资讯摘要

AWS 正在更新 OpenSearch Serverless,以适应一种新的互联网流量模式:AI 代理会在短时间内集中发起大量请求,快速查询多个系统,然后又迅速消失。AWS 将这项服务描述为一个完全托管的搜索和向量数据库,目标是服务于智能体工作负载,而不是稳定、持续的人类浏览流量。AWS 表示,新一代系统可以在代理触发任务时立即扩展计算资源,并在需求结束后缩减到零。这样做很重要,因为旧版 serverless 模式仍然至少需要运行一个实例,客户即使没有实际使用也要为闲置计算付费。

Amazon OpenSearch Service 总经理 Tia White 说,这次改动是为了让生产环境中的代理流量可以在不支付空转成本的情况下稳定运行。文章将这一变化放在更大的行业背景下来看,指出机器生成流量已经很大,而且还会继续增长。Cloudflare 说,在过去六个月里,机器人占总体 HTTP 流量的 31%,而非人类流量可能会在 2027 年上半年超过人类流量。报道还提到,Google 最近也在推动可委派任务的 AI 系统,而 Microsoft、Databricks、Snowflake 和 Cloudflare 也在进行类似的基础设施调整。

AWS 将 OpenSearch 重建为面向 AI 代理

资讯正文

云基础设施长期以来都是围绕人类来设计的——人们会以稳定且可预测的方式搜索、点击、滚动和流媒体播放。而 AI 智能体的行为则不同。它们可以突然引发一波活动,启动多个子智能体,在几秒钟内查询数百个数据库、搜索文档并调用 API,然后又像来时一样迅速消失。

在这一前提下,亚马逊正在重构其云基础设施的一个核心部分。周四,AWS 推出了下一代 OpenSearch Serverless,这是一种完全托管的搜索和向量数据库——本质上是一套用于大规模存储和检索信息的系统——专为智能体工作负载而设计。AWS 表示,这套新系统在智能体触发任务时可以立即扩容,而在空闲时又能缩减到零。

这次发布反映出科技行业日益形成的一种共识:最初为人类驱动的互联网而设计的基础设施,在一个越来越多由智能体构成的世界里,效果并没有那么好。

尽管 AI 智能体在互联网活动中仍只占相对较小的一部分,但机器生成的流量已经相当可观,而且还在增长。Cloudflare 表示,在过去六个月里,机器人占总体 HTTP 流量的 31%。在此期间,AI 爬虫、搜索引擎和助手约占所有机器人请求的四分之一。

Cloudflare 高级产品经理 Lai Yi Ohlsen 对 TechCrunch 表示:“在 2027 年上半年某个时候,非人类流量将超过人类流量。”

在上周的 Google I/O 开发者大会上,该公司表示,用户将能够开始把一些任务委托给 AI 系统,比如研究购物、预订旅行、浏览网页以及与应用交互。但关注消费级 AI 智能体的并不止于此。企业正越来越多地在内部和面向客户的场景中部署智能体,从而在幕后创造出新的机器生成流量。

因此,云服务提供商和基础设施公司一直在思考,如何将为人类构建的系统适配到一个由智能体组成的世界——这些智能体会持续且自主地检索信息、调用工具,并生成机器对机器的流量。

这正是 AWS 新版 OpenSearch Serverless 的用武之地。

Amazon OpenSearch Service 总经理 Tia White 对 TechCrunch 表示:“时机很明确。智能体正在从实验走向生产,而它们会产生以往基础设施根本没有为之设计的流量模式。它们会毫无预警地激增,也会在无人提醒时进入空闲状态,企业需要能够跟上这种变化的搜索能力,而不必为空置或闲置的计算资源付费。”

这一新一代产品的关键技术变化在于,它将计算与存储解耦,使计算能够在数秒内扩容以应对智能体流量激增,并在缩减到零时让客户在智能体空闲时支付 0 美元。

“以前,即便是在我们之前的 Serverless 版本中,你也至少得有一个实例在运行,因为存储和计算是耦合在一起的,”White 说。“你不能只是按需自动启动所需速度的[计算资源],所以无论你是否在使用它,都会始终为你的工作负载保留闲置计算资源。”

可以把这想成即使你不用停车位,也得一直付停车费。对于 AWS 升级后的 Serverless 来说,这更像是按计时收费的停车位。

在发布时,OpenSearch Serverless 将原生集成 Vercel 和 Kiro 等 AI 开发平台,因此开发者可以在无需管理基础设施的情况下,为智能体部署可直接用于生产的搜索和向量后端。

这种转变正在云行业中显现。Databricks 和 Snowflake 正在将自己重新定位为企业数据的 AI 记忆和检索系统。微软已经推出了针对 Azure 的更新,旨在处理 AI 智能体的突发负载,并在智能体之间共享记忆。与 Amazon 类似,Cloudflare 上个月也推出了面向智能体的基础设施,旨在为它们提供持久环境和即时扩展能力。

部署 AI 智能体的公司越多,就越会给围绕机器生成工作负载重构基础设施带来压力,而这反过来可能会让智能体更便宜,也更容易在更大规模上部署。

来源与参考

  1. 原始链接
  2. The internet is being rebuilt for machines | TechCrunch

收录于 2026-05-29