Topic
#ai-agents
按主题聚合的新闻视图。
Topic Feed
主题:ai-agents
共 107 条
CVE-2026-LGTM:AI审查失控的讽刺
Simon Willison 链接了 Andrew Nesbitt 的讽刺作品《Incident Report: CVE-2026-LGTM》,其中设想两个来自不同厂商的 AI 代码审查代理在一个依赖升级 foxhole-lz4 的拉取请求上陷入争论循环。这个虚构事件最终演变成 340 条评论和 41,255 美元的推理成本,随后财务部门撤销了两个 API 密钥。

Patronus AI 融资5000万美元打造智能体压力测试世界
Patronus AI 宣布完成由 Greenfield Partners 领投的 5000 万美元 B 轮融资,用于构建模拟“数字世界”来测试 AI 智能体。此次融资后,这家位于旧金山的初创公司累计融资达到 7000 万美元。

General Intuition 押注游戏训练 AI 用于现实机器人
General Intuition 在周四宣布完成 3.2 亿美元融资,投后估值达到 23 亿美元,也证实了 TechCrunch 先前的报道。该公司表示,其智能体可以从电子游戏玩法中学习,并将这些能力迁移到仿真环境和现实世界机器人上。

Google 将计算机控制嵌入 Gemini 3.5 Flash
Google 已将 Computer Use 直接集成到 Gemini 3.5 Flash 中,使模型能够在电脑、浏览器和移动设备上观察并操作屏幕。此前,这一能力只作为独立的 Gemini 2.5 模型提供。
OpenAI称智能体正在重塑工作
OpenAI强调了一篇新的研究论文,认为AI智能体能够处理比以往系统更长、更复杂的任务。该公司表示,这些智能体已经在多个工作岗位上提升了生产力。

客服 AI 代理快速实现回报
Salesforce 的一项调查显示,70% 使用 AI 代理的服务组织在部署后 60 天内就看到了正向结果。调查还发现,客户服务中的 agentic AI 采用率在过去一年里从 39% 上升到 66%,预计到 2026 年底将达到 88%。

Gemini 3.5 Flash 内置计算机使用
Google 表示,computer use 现在已经成为 Gemini 3.5 Flash 的内置工具,取代了此前独立的 Gemini 2.5 computer use 模型。开发者现在可以直接用主力 Flash 模型构建能够在浏览器、移动设备和桌面环境中看、推理并执行操作的代理。

Anthropic 在 Slack 推出 Claude Tag
Anthropic 推出了 Claude Tag,这是一项 Slack 集成功能,允许用户在频道中直接 @Claude 来分配任务。公司表示,其内部版本已经为产品团队生成了 65% 的代码,而这项新功能目前已向 Claude Enterprise 和 Team 客户开放测试版。

MoEngage收购Aampe,押注AI代理营销
MoEngage 已以全现金方式收购旧金山初创公司 Aampe,目标是围绕为单个客户决策的 AI 代理来构建营销体系。双方没有披露交易金额,但 TechCrunch 报道称,这笔交易价值数千万美元。

Boris Cherny:AI 编码循环是下一步
在 Meta 的 @Scale 大会上,Claude Code 创作者 Boris Cherny 表示,AI“循环”是真实存在的,并且是软件开发的下一次重大转变。他描述的是一种让一个代理去提示另一个代理、持续改进代码的工作方式,而不是只做一次性的代理式编码。

Data2Story将CSV变成可验证新闻文章
牛津大学和斯坦福大学的研究人员开发了 Data2Story,这是一项 Claude Code 技能,依靠七个专门的 AI 智能体把 CSV 文件转换成交互式新闻文章。该系统会生成叙事文本、图表和背景信息,并内置 Inspector 面板,将可见的结论和素材追溯到代码、数据或外部来源。

Cloudflare 将 Flue 加入代理支架栈
Cloudflare 表示,2026 年将是代理支架进入生产环境的一年,并把 Project Think 中验证过的生产加固能力带入 Cloudflare Agents SDK。与此同时,它推出了来自 Astro 团队的开源框架 Flue,作为第一个建立在该平台层之上的框架。

AI代理自动化机器人训练硬件任务
NVIDIA GEAR 研究人员联合卡内基梅隆大学和加州大学伯克利分校的合作者,推出了 ENPIRE,这是一种让 AI 编码代理能够自主设计机器人训练方案的代理框架。借助它,代理们教会了机器人执行剪断扎带、将 GPU 插入主板插槽等任务。

Respond.io 融资 6250 万美元扩展 AI 消息业务
总部位于马来西亚的 Respond.io 完成了由 Camber Partners 领投的 6250 万美元 B 轮融资,Endeavor Catalyst 和现有投资者也参与其中。公司表示其年度经常性收入已达到 3500 万美元,并且同比增长 169%,接下来将把这笔资金用于增长和并购。

NewCore 获 6600 万美元打造 AI 代理身份管理
网络安全初创公司 NewCore 结束隐身并获得 6600 万美元融资,目标是为 AI 代理构建身份认证和访问控制能力。该轮融资由 Cyberstarts 领投,Index Ventures 和 Evolution Equity Partners 参与投资,投后估值达到 3 亿美元。

SkillOpt 用 Markdown 技能提升 GPT-5.5
微软与三所中国大学提出了 SkillOpt,这是一种把 AI 代理的指令文档当作可训练状态来优化的方法。报道中的结果显示,一个经过训练的 Markdown 技能文件让 GPT-5.5 在流程型任务上的表现提升了 20 多分。

Visa与OpenAI推进智能代理支付
Visa和OpenAI于周三宣布达成合作,将在OpenAI产品中支持代理式交易,包括Atlas和ChatGPT Shopping等界面。Visa表示,其Trusted Agent Protocol及其他安全层将允许开发者和商家在用户设定的控制条件下接受AI代理发起的支付。

企业若缺乏治理可能放弃AI代理
ZDNET报道,Gartner预计到2027年,40%的企业将降级或弃用自主AI代理,因为治理缺口往往要等到生产事故发生后才会暴露。文章还总结了Snowflake Summit上三位企业负责人的部署经验:使用框架、借助专家、以及让数据变现。

把AI代理当作需要严管的实习生
ZDNET 报道了在 Snowflake Summit 上的一场讨论,安全和 AI 领域的嘉宾认为,AI 代理应该像热情但容易跑偏的实习生一样被管理。讨论重点是为代理设置严格权限、明确目标,并在人类监督下让它们访问应用和数据。

Perplexity 让模型自己写搜索流水线
Perplexity 推出了“Search as Code”(SaC)架构,让 AI 模型生成自定义的 Python 搜索工作流,而不是调用固定的搜索 API。该系统正在 Perplexity Computer 和 Agent API 中逐步上线。

Meta 准备推出首款付费 AI 代理 Hatch
据报道,Meta 正在开发一款名为 Hatch 的付费 AI 代理,月费最高可能达到 200 美元。内部材料还显示,它会提供免费版和名为“Hatch Plus”的订阅层级,后者拥有高得多的使用额度,并计划在 7 月面向美国更广泛推出。

Apple批准首个接入Messages for Business的AI代理
Poke成为首个获批在Apple的Messages for Business平台上运行的独立AI代理。这样一来,这家初创公司就能把iMessage加入其现有的短信、Telegram以及部分市场中的WhatsApp分发渠道。

Perplexity 推出本地云端混合 AI 路由
Perplexity 宣布了一套混合式 AI 编排系统,能够自动决定每个任务是在本地设备还是云端运行。该系统将从 7 月起集成到其 Always-on 代理产品 Personal Computer 中。

Meta 的 Business Agent 全球上线 WhatsApp
Meta 周三表示,其客户支持机器人现已更名为 Meta Business Agent,并在 WhatsApp Business 中全球可用。该公司还将其扩展到 Instagram 私信,同时测试夜间聊天摘要和洞察等新功能。

Coralogix 融资 2 亿美元布局 AI 代理监控
Coralogix 完成了 2 亿美元的 F 轮融资,投后估值达到 16 亿美元。公司表示,这笔资金将用于加速面向 AI 代理和其他自主软件系统的监控、排障和管理产品。

Nous Research 发布 Hermes Desktop 桌面 AI 代理
Nous Research 发布了 Hermes Desktop,这是一款采用 MIT 许可证的开源 AI 代理应用,目前已在 Windows、macOS 和 Linux 上开放公测。该应用把持久记忆、多应用通信、子代理委派和沙箱执行后端整合到一个跨平台桌面软件中。

微软 Project Solara 面向 AI 代理
在 Build 2026 上,微软公布了 Project Solara,这是一个基于 Android 的概念操作系统,目标不是运行传统应用,而是运行 AI 代理。该系统被描述为一种芯片到云端的平台,围绕“即时生成界面”来按需创建交互界面。

微软提出AI代理控制开放标准
微软推出了一个名为 Agent Control Specification(ACS)的开源标准,帮助开发者以更一致的方式管理 AI 代理行为。该规范通过策略文件定义代理可以做什么、禁止做什么、何时需要人工批准,以及必须记录哪些证据。

Gemini Spark 的旅行规划既惊艳又令人不安
《The Verge》评测了谷歌新的常开式 AI 代理 Spark,发现它不仅能完成普通聊天任务,还能调用多种谷歌数据生成高度个性化的结果。在一次测试中,它根据 Gmail、Docs 等信息生成了非常详细的周末行程,而该功能目前已向谷歌每月 99 美元的 AI Ultra 订阅开放。

Gemini Spark 表现惊艳但引发成本与隐私担忧
The Verge 的上手评测称,Google 新的 Gemini Spark AI agent 能代替用户完成相当复杂的多步骤任务,包括起草邮件、查找文件和更新日历。测试者发现它在很多时候确实像 Google I/O 上的演示一样出色,但仍不足以消除人们对成本和信任的担忧。

AI 搜索代理可能主要是在确认记忆
哈尔滨工业大学和小红书的研究人员发表的一项研究认为,领先的 AI 搜索代理往往依赖内部知识,而不是真正进行网页研究。研究团队还提出了 LiveBrowseComp,这是一个由近期、时效性很强的问题组成的新基准,理论上模型不应仅靠训练记忆就能答出。

Salesforce称AI代理将迁移从231天缩短到13天
Salesforce表示,已将整个软件开发组织迁移到由 Anthropic 的 Claude Code 驱动的代理式工作流,并向全公司开发者开放无限 token 使用。在一个 API 迁移案例中,公司称 AI 辅助工作流把原本估算需要 231 人日的工作缩短到了 13 天。

代码是AI代理的运行基底
来自 Meta、斯坦福大学和伊利诺伊大学厄巴纳-香槟分校的研究者发表了一篇综述论文,认为代码是 AI 代理进行推理、行动和协作的核心。论文同时强调了围绕模型的“harness”软件层,它能把无状态模型变成持续运行的代理系统。

Asana 以 7500 万美元收购 StackAI
Asana 以 7500 万美元收购了无代码工作流自动化公司 StackAI。StackAI 的创始人 Tony Rosinol 和 Bernard Aceituno 将作为交易的一部分加入 Asana。

Sesame推出对话式AI的iOS预览版
由Oculus创始人共同创立的AI初创公司Sesame,已经通过一款新的iOS应用发布了其对话式AI代理的公开预览版。该应用推出了四个代理——Maya、Miles、Simone和Charlie——它们可以边搜索边组织回答,而不是等全部完成后再开口回应。

Robinhood开放AI代理交易和刷卡消费
Robinhood正在推出一项测试版功能,允许Anthropic的Claude或Cursor等AI代理通过Model Context Protocol(MCP)连接到一个独立的投资账户。这些代理可以读取投资组合数据,并在当前测试版中代用户买卖股票;同时还可以连接一张虚拟的Robinhood信用卡,用于购买机票或餐厅预订等消费。

阿里 Qwen3.7-Max 自主运行 35 小时优化芯片代码
阿里巴巴的 Qwen 团队发布了 Qwen3.7-Max,这是一款面向长时间代理任务的专有模型,只能通过阿里云 Model Studio API 使用。在一次演示中,它在阿里自家的 T-Head-ZW-M890 加速器平台上,连续自主优化硬件注意力内核长达 35 小时。

DeepSeek打造代码智能体对标Claude Code
据报道,DeepSeek正在打造一款名为“Deepseek Code”的新代码智能体,并在北京组建专门的“Harness”团队从零开始开发。该项目旨在把模型研究与智能体能力结合起来,包括工具调用、规划和记忆。

谷歌押注自己能让 AI 代理真正有用
《The Verge》称,谷歌在 I/O 2026 上推出了新一轮 AI 代理攻势,包括面向消费者的 Gemini Spark、Daily Brief 功能,以及更广泛的谷歌内部和外部服务集成。谷歌表示,部分功能本周开始推出,另一些则会在未来几个月陆续上线。

谷歌推出 Gemini Spark AI 代理
谷歌在 I/O 2026 上发布了 Gemini Spark,这是一款由 Gemini 3.5 Flash 驱动的常驻 AI 代理。它可以在后台持续运行,连接 Google Workspace,并通过模型上下文协议(MCP)扩展到第三方应用。

Claude 代理接入 Cloudflare 沙盒
Cloudflare 和 Anthropic 宣布了一项集成,使 Claude Managed Agents 可以运行在 Cloudflare Sandboxes 中。开发者可以把 Claude 的代理循环保留在 Anthropic 平台上,同时用 Cloudflare 负责代码执行、工具调用、连接能力和可观测性。

四个 AI 模型运营电台六个月
Andon Labs 进行了一项为期六个月的实验,让 Claude、GPT、Gemini 和 Grok 在相同条件下分别自主运营自己的电台。它们只有 20 美元预算,并且可以完全控制节目编排、与听众互动和自行寻找赞助。

OPPO开源端侧Android AI代理X-OmniClaw
OPPO的Multi-X团队开源了X-OmniClaw,这是一个Android AI代理,可以利用摄像头、屏幕和语音在多个应用中执行任务,而且直接运行在实体手机上。该系统以本地运行为主,只有在需要更高层次推理时才会调用云端模型。

OpenClaw 运行 100 个 AI 代理,月账单达 130 万美元
OpenClaw 创始人 Peter Steinberger 表示,他的团队在云端运行大约 100 个 Codex 实例,用于写代码、审查拉取请求、发现漏洞和分析安全问题。他称 OpenAI API 在 30 天内的账单达到 130 万美元,消耗了 6030 亿个 token 和 760 万次请求。

Notion 将工作区变成 AI 代理枢纽
Notion 发布了一个开发者平台,让团队能够构建和协调 AI 代理,连接外部代理,并在工具和数据库之间创建多步骤工作流。它还推出了 Workers、数据库同步和 External Agent API 等新能力。
OpenAI 为 Codex 打造 Windows 沙箱
OpenAI 发布了一篇技术说明,介绍它如何为 Codex 构建一个安全的 Windows 沙箱。这个沙箱旨在让编码代理在受控的文件访问和网络限制下运行。

MachinaCheck 在 AMD MI300X 上自动化 CNC 可制造性检查
MachinaCheck 是一个多智能体 AI 系统,它会分析 STEP 文件以及材料、公差和螺纹要求,并在大约 30 秒内生成可制造性报告。该系统在 AMD Instinct MI300X 上本地运行 Qwen 2.5 7B Instruct,因此客户几何数据不会离开工厂环境。
OpenAI 如何安全运行 Codex
OpenAI 发布了一篇技术说明,介绍它如何通过沙箱、审批流程、网络策略和面向智能体的遥测来安全运行 Codex。文章详细说明了 OpenAI 如何通过这些运行控制,把编码智能体限制在明确边界内,同时保留有用的开发自动化能力。

Perplexity 向所有 Mac 用户开放 Personal Computer
Perplexity 已通过新的桌面应用将 Personal Computer 功能向所有 Mac 用户开放。该功能此前仅限 Perplexity Max 订阅用户并需要排队等候,而现在仍然需要 Pro 或 Max 订阅才能使用。

Anthropic 为 Claude 托管代理加入“Dreaming”
Anthropic 正在为 Claude 托管代理新增“Dreaming”研究预览,同时将 Outcomes 和多代理编排推向公开测试版。Dreaming 允许代理回顾之前的会话并改进记忆,从而从反复出现的错误和成功流程中学习。

Anthropic 为 Claude 托管代理加入“梦境”功能
Anthropic 在旧金山举行的 Code with Claude 开发者大会上,为 Claude 托管代理推出了一个名为“dreaming(梦境)”的研究预览功能。该功能会定期回顾最近会话,筛选有用记忆,并可更新代理的记忆库,以改进后续任务表现。

谷歌和Meta追赶个人AI代理
谷歌和Meta都在测试面向日常任务的个人AI代理,试图追赶Anthropic、OpenAI和微软。谷歌据称已经关闭Project Mariner,并在开发代号为Remy的新内部代理;Meta则在打造Hatch以及一个面向Instagram的购物代理。
AI 在斯德哥尔摩经营咖啡馆
Andon Labs 在瑞典斯德哥尔摩启动了一项新的 AI 经营咖啡馆实验,延续了他们此前在旧金山做过的 AI 经营零售店测试。这个项目已经出现了一些有趣又离谱的运营决策,例如咖啡馆明明没有炉灶,AI 主管却下单买了鸡蛋,还用自己生成的草图去申请室外座位许可。

CopilotKit 融资 2700 万美元推进应用内 AI 代理
CopilotKit 已完成一轮 2700 万美元的 A 轮融资,由 Glilot Capital、NFX 和 SignalFire 领投。该公司正扩展其 AG-UI 协议和企业工具包,帮助开发者在应用内部署具备交互式、应用专属界面的 AI 代理。

AI 代理成本高度不稳定
一项由密歇根大学的 Longju Bai 领衔、并联合斯坦福、DeepMind、Microsoft、MIT 和 All Hands AI 的新研究发现,AI 代理消耗的 token 远远高于普通聊天提示。研究人员指出,即使是同一个模型在同一任务上,代理的 token 使用量也高度波动,而且很难预测。

AI 代理激增推动代理管理平台兴起
ZDNET 报道称,企业中的 AI 代理数量正在快速增长,文中援引 Statista 的数据指出,全球目前有 2860 万个活跃代理,预计到 2030 年将超过 22 亿个。为应对这一趋势,一类新的代理管理平台正在出现,用于管理、协调和治理这些代理。

微软推出Word法律代理AI用于合同审查
微软在Word中推出了名为Legal Agent的专用AI代理,专为法律团队设计,可基于真实法律实践的结构化流程逐条审查合同。它直接集成到Copilot中,帮助识别风险、遵守内部规范并建议修改,但不会取代人类判断。

Stripe推出Link数字钱包,让AI代理安全处理支付
Stripe推出了Link数字钱包,使自主AI代理能够在不访问用户原始支付凭证的情况下代表用户进行购买。它支持基于OAuth的授权,并提供虚拟卡或共享支付令牌(SPT)以实现安全、可编程的支出。

Cloudflare代理现在可自动完成完整部署设置
Cloudflare现在允许AI代理自主创建账户、购买订阅、注册域名并生成API令牌,从而立即部署代码——无需用户进行任何手动操作。

OpenAI 或将推出以AI代理为核心功能的智能手机
OpenAI 正在开发一款用 AI 代理取代传统应用的智能手机,与联发科、高通和立讯精密合作打造。该设备将采用定制芯片,并结合本地和云端模型来持续理解用户情境。

谷歌与Kaggle将于2026年6月推出免费AI代理Vibe编码课程
谷歌与Kaggle将于2026年6月15日至19日举办为期五天的免费AI代理强化课程,重点教授如何使用自然语言工作流和实践项目构建可投入生产的AI代理。

研究人员称AI代理扩展了软件工程,远超代码范畴
来自查尔姆斯理工大学和沃尔沃集团的研究人员表示,AI代理并未取代软件工程师,而是将该领域扩展到了提示、工作流和决策流程等‘半可执行产物’。他们提出了一个名为‘半可执行栈’的六层模型来描绘这一扩展范围。

Anthropic测试AI代理在真实市场中交易
Anthropic开展了一个名为“Project Deal”的试点实验,让AI代理作为买家和卖家在真实市场中完成交易,总成交额超过4000美元。研究发现,即使用户未察觉差异,更先进的模型仍能带来更好的结果。

谷歌开源 DESIGN.md 格式,助力AI生成品牌一致的设计
谷歌开源了 DESIGN.md 格式,这是一种可被机器读取的 Markdown 文件,用于在跨平台项目中保持 UI 的一致性。该格式包含 YAML 格式的视觉参数(如颜色和字体)以及说明文字,帮助 AI 理解设计意图。

OpenAI推出可定制的企业级AI代理工具
OpenAI现在向商业、企业、教育和教师计划用户提供基于云的“工作区代理”,这些代理可以自动执行任务,例如在Slack中发送报告或在Gmail中起草邮件。

OpenAI发布工作区代理,让ChatGPT成为团队自动化平台
OpenAI在ChatGPT中推出了由Codex驱动的工作区代理,这些代理能自主处理复杂的多步骤团队任务,访问文件、工具和Slack等系统。它们在具有持久记忆的独立工作空间中运行,即使用户离线也能继续执行任务。
OpenAI 推出基于 Codex 的团队工作区代理
OpenAI 推出了 ChatGPT 中的“工作区代理”,这些基于 Codex 的云端 AI 代理可自动执行复杂的团队任务,并在用户离线时仍持续运行。
利用 WebSocket 加速代理工作流的响应 API
OpenAI 提出了一种新方法,通过使用 WebSocket 和连接作用域缓存来减少代理工作流中的 API 开销和模型延迟,特别是在 Codex 代理循环中。

AI代理编排推动多代理工作流
AI代理正从单任务工具演变为能够处理复杂多步骤工作流的协同团队。Anthropic的Claude Code和OpenAI的Codex等新平台使多个专业代理能协作完成编程、研究和办公自动化等任务。

AI实验室NeoCognition完成4000万美元融资,致力于打造类人自主学习智能体
前俄亥俄州立大学教授Yu Su创立了NeoCognition,这是一家开发类人自主学习智能体的初创公司。该公司已获得4000万美元种子轮融资,投资方包括Cambium Capital、Walden Catalyst Ventures和Vista Equity Partners。

扩展代理型AI需要可信数据与流程重塑
企业必须优先考虑高质量、可访问的数据并重新设计工作流程,才能有效扩展代理型AI。麦肯锡报告指出,全球近三分之二的企业已尝试使用AI代理,但不到10%实现了规模化价值。
AI代理过于人性化——这反而成了问题
安德烈亚斯·帕尔松-诺蒂尼指出,当前的AI代理表现出令人沮丧的人类特质,如缺乏严谨性、耐心和专注力,这些特质阻碍了它们的可靠性和表现。

Moonshot AI 的 Kimi K2.6 使用 1000 个智能体自主处理复杂任务
Moonshot AI 发布了 Kimi K2.6,这是一个开源模型,可使用多达 1000 个协作的 AI 智能体自主执行长时间编码任务。它在 10 小时内构建了一个完整的 SysY 编译器,并为洛杉矶 30 家餐厅创建了着陆页而无需人工干预。

开源模型Kimi K2.6通过代理群组挑战GPT-5.4和Claude Opus 4.6
Moonshot AI发布了开源的Kimi K2.6模型,该模型可通过名为“代理群组”的系统并行运行多达300个子代理,从而自主完成生成网站、文档和电子表格等复杂任务。

Adobe推出CX企业AI平台以应对人工智能冲击
Adobe推出了CX Enterprise平台,这是一个基于AI代理的系统,旨在自动化营销、销售和客户互动任务。该平台与包括OpenAI、微软和英伟达在内的30多家AI合作伙伴集成。

Salesforce推出“Agent Albert”以应对AI颠覆企业软件的担忧
Salesforce推出了名为“Agent Albert”的新AI代理,预计今年底发布,并引入了“智能工作单元”(AWU)这一指标来衡量AI在企业生产力中的实际影响。

Cloudflare推出面向AI代理的智能云工具
Cloudflare在2026年代理周上发布了一系列新基础设施原语,包括用于隔离代理执行的Sandboxes、用于Git兼容版本化存储的Artifacts,以及增强版Durable Objects以支持有状态代理应用。这些工具旨在支持大量并行AI代理同时运行。
无头服务正成为个人AI的未来
文章指出,无头服务(如API、命令行工具和MCP协议)正成为个人AI代理的关键,因为它们比传统的GUI交互更快更可靠。Salesforce推出了Headless 360,将其整个平台作为API和CLI命令暴露给AI代理。

VisionClaw AI代理让雷朋Meta眼镜加速日常任务完成
科罗拉多大学、光州科学技术院和谷歌的研究人员开发了VisionClaw,这是一个始终在线的AI代理,运行在雷朋Meta眼镜上,结合实时环境感知与自主数字任务执行,利用浏览器、邮件和日历等工具。

谷歌发布A2UI 0.9,推动AI代理生成式用户界面
谷歌发布了A2UI 0.9,这是一个与框架无关的标准,使AI代理能够动态使用现有应用组件在网页、移动设备及其他平台上生成用户界面。

Salesforce首席执行官称API是AI代理的新界面
Salesforce首席执行官马克·贝尼奥夫表示,API正在取代传统用户界面,成为AI代理与企业系统交互的主要方式。该公司通过‘无头360’平台实施这一愿景,该平台通过API、MCP(模型上下文协议)和命令行界面(CLI)暴露Agentforce和Slack等工具。

Cloudflare推出网站AI代理就绪评分工具
Cloudflare推出了isitagentready.com,这是一个评估网站与AI代理兼容性的新工具,并引入了一个数据集来追踪整个互联网上代理标准的采用情况。

Cloudflare推出Agent Memory,实现AI代理持久记忆
Cloudflare推出了Agent Memory的私有测试版,这是一个托管服务,能让AI代理在不占用上下文窗口的情况下存储和检索有用信息。它通过隔离的资料档案实现记忆的摄入、检索和回忆操作。

OpenAI Codex新增后台电脑使用功能,可自主执行任务
OpenAI的新版Codex桌面应用现在允许AI在后台执行任务——通过自己的光标进行查看、点击和输入,且不会干扰用户的当前工作。它还支持计划未来任务,并内置网页浏览器以实现交互式反馈。

Cloudflare推出统一AI推理层以支持智能体应用
Cloudflare推出了一个统一的AI推理层,开发者可通过单一API在超过70个来自12家以上提供商的模型之间动态切换。该平台支持Workers和REST API,并具备成本监控、自动重试和元数据标记等功能,用于精细化追踪使用情况。

Cloudflare AI搜索:AI代理的统一检索原语
Cloudflare发布了AI搜索(前身为AutoRAG),这是一种可即插即用的搜索原语,支持AI代理的混合语义和关键词检索。它现在包含内置存储、按代理或客户动态创建实例,以及基于元数据的排名优化。

Cloudflare邮件服务进入公开测试,专为AI代理设计
Cloudflare推出了其邮件服务的公开测试版,开发者可以利用邮件作为通用通信渠道构建基于代理的工作流。新功能包括已进入公开测试的邮件发送、邮件路由以及带有原生邮件钩子的代理SDK。

印度初创公司Emergent推出Wingman AI代理,实现消息驱动的任务自动化
印度初创公司Emergent推出了Wingman——一个基于消息平台(如WhatsApp和Telegram)的自主AI代理,可跨工作流处理日常任务。

Cloudflare将浏览器渲染重命名为Browser Run以支持AI代理
Cloudflare将浏览器渲染服务更名为Browser Run,并新增了实时视图、人工介入、Chrome开发者工具协议(CDP)接口、MCP客户端支持和WebMCP集成等功能,使AI代理能够全面控制浏览器会话。

Cloudflare发布Project Think,打造持久运行的AI代理
Cloudflare推出了Project Think,这是一个全新的AI代理SDK,包含持久执行、子代理、持久会话和沙盒代码执行功能,使AI能够执行复杂且长时间的任务,而不仅仅是编写代码。

Gitar融资900万美元,用AI代理解决代码验证问题
由Ali-Reza Adl-Tabatabai创立的Gitar公司从秘密状态中现身,并获得了900万美元融资,旨在利用AI代理来验证和管理软件开发流程中的代码质量。

Cloudflare为Agents SDK新增语音功能,支持实时交互
Cloudflare发布了其Agents SDK的实验性语音管道,使用户能够在与文本提示相同的代理架构中进行实时语音交互。新包@cloudflare/voice支持完整对话代理和仅语音转文字的使用场景,可通过React钩子或无框架依赖的客户端实现。

Cloudflare Mesh:为AI代理提供安全私有网络连接
Cloudflare推出了Cloudflare Mesh,这是一种专为AI代理设计的新型私有网络解决方案,无需依赖传统的VPN或SSH隧道即可实现安全自动访问。它可与现有的Cloudflare One零信任架构无缝集成,为自主代理提供私有资源的安全访问。

微软正在开发类似OpenClaw的本地AI代理,面向企业用户
微软正在测试一款受OpenClaw启发的本地运行AI代理,专为企业客户设计,并集成到Microsoft 365 Copilot中。该代理将能自主运行并执行多步骤任务,相比开源版本具有更好的安全性。
Cloudflare将OpenAI的GPT-5.4和Codex集成到Agent Cloud中
Cloudflare已将其Agent Cloud平台接入OpenAI最新模型GPT-5.4和Codex,使企业能够以更高的速度和安全性构建并扩展用于实际任务的AI代理。


布雷特·泰勒:点击式软件时代即将终结
Sierra的CEO布雷特·泰勒推出了Ghostwriter工具,该工具能根据自然语言提示自动创建AI代理来替代传统的点击式软件界面。这标志着企业应用中向语言驱动任务执行的转变。

Anthropic推出自主AI代理的托管基础设施
Anthropic推出了名为‘Claude托管代理’的公开测试版,开发者无需自行管理基础设施即可构建和运行自主AI代理。早期用户包括Notion、Rakuten和Sentry,分别用于任务委派、企业自动化和调试。

Poke让AI代理像发短信一样简单
Poke推出了一款新的AI代理,可通过iMessage、短信、Telegram和WhatsApp(部分区域)发送文字消息完成日程管理、智能家居控制和健康追踪等现实任务。用户只需访问Poke.com并输入手机号即可使用,无需安装任何应用。

Astropad 推出 Workbench 工具,专为管理 AI 代理设计
Astropad 推出了 Workbench,这是一个专为管理运行在苹果设备(如 Mac Mini)上的 AI 代理而设计的远程桌面应用。它包含高保真流媒体、通过苹果语音模型进行语音输入,并支持 iPad 和 iPhone 多设备访问。

ALTK-Evolve 让 AI 代理从经验中学习可复用的原则
ALTK-Evolve 引入了一个记忆系统,从代理轨迹中提取可复用的指导原则,而不是重复阅读日志,使代理能够在不增加上下文大小的情况下泛化并持续改进。

企业必须围绕AI代理重新设计工作流程
企业必须从将AI代理嵌入旧系统转向围绕它们重新设计整个工作流程。这种以代理为中心的方法可借助生成式AI实现自主和自适应的过程优化。

Claude AI现在可直接控制Mac和Windows桌面
Anthropic推出了一项研究预览功能,允许其Claude AI直接控制用户的Mac和Windows桌面,包括打开应用程序、浏览网页和填写电子表格。该功能现已对Pro和Max用户开放,可在Windows版的Claude Code和Claude Cowork中使用,此前仅限于macOS。
Gradient Labs为每位银行客户推出AI账户经理
Gradient Labs部署了GPT-4.1和GPT-5.4 mini/nano模型,驱动自主AI代理处理银行支持工作流,具有低延迟和高可靠性。

MetaClaw利用谷歌日历在空闲时段训练AI代理
MetaClaw是一个框架,通过自动生成行为规则并利用强化学习在用户空闲时段(由谷歌日历、键盘活动和睡眠时间检测)更新模型权重,使AI代理能够从错误中学习。
马特·韦伯谈代理编码的局限性
马特·韦伯批评代理编码倾向于通过暴力迭代(如无限使用while循环)解决问题,即使代价是消耗海量计算资源。他指出真正的目标应该是可维护、可组合且具有架构意识的AI驱动软件开发。

Mozilla开发者推出'cq',打造AI代理的Stack Overflow
Mozilla开发者彼得·威尔逊推出了名为'cq'的项目,旨在为AI代理创建一个类似Stack Overflow的集中式知识库,解决代理间因信息过时和重复解决问题而造成的低效问题。