Topic

#ai-agents

按主题聚合的新闻视图。

Topic Feed

主题：ai-agents

共 107 条

Simon Willison·6月27日 01:58 UTC
CVE-2026-LGTM：AI审查失控的讽刺
Simon Willison 链接了 Andrew Nesbitt 的讽刺作品《Incident Report: CVE-2026-LGTM》，其中设想两个来自不同厂商的 AI 代码审查代理在一个依赖升级 foxhole-lz4 的拉取请求上陷入争论循环。这个虚构事件最终演变成 340 条评论和 41,255 美元的推理成本，随后财务部门撤销了两个 API 密钥。
#ai-agents评分 6.0
TechCrunch AI·6月26日 04:19 UTC
Patronus AI 融资5000万美元打造智能体压力测试世界
Patronus AI 宣布完成由 Greenfield Partners 领投的 5000 万美元 B 轮融资，用于构建模拟“数字世界”来测试 AI 智能体。此次融资后，这家位于旧金山的初创公司累计融资达到 7000 万美元。
#ai-agents评分 8.0
TechCrunch AI·6月26日 00:55 UTC
General Intuition 押注游戏训练 AI 用于现实机器人
General Intuition 在周四宣布完成 3.2 亿美元融资，投后估值达到 23 亿美元，也证实了 TechCrunch 先前的报道。该公司表示，其智能体可以从电子游戏玩法中学习，并将这些能力迁移到仿真环境和现实世界机器人上。
#ai-agents评分 7.0
The Decoder·6月25日 17:04 UTC
Google 将计算机控制嵌入 Gemini 3.5 Flash
Google 已将 Computer Use 直接集成到 Gemini 3.5 Flash 中，使模型能够在电脑、浏览器和移动设备上观察并操作屏幕。此前，这一能力只作为独立的 Gemini 2.5 模型提供。
#ai-agents评分 8.0
OpenAI News·6月25日 10:00 UTC
OpenAI称智能体正在重塑工作
OpenAI强调了一篇新的研究论文，认为AI智能体能够处理比以往系统更长、更复杂的任务。该公司表示，这些智能体已经在多个工作岗位上提升了生产力。
#ai-agents评分 7.0
ZDNET AI·6月25日 02:52 UTC
客服 AI 代理快速实现回报
Salesforce 的一项调查显示，70% 使用 AI 代理的服务组织在部署后 60 天内就看到了正向结果。调查还发现，客户服务中的 agentic AI 采用率在过去一年里从 39% 上升到 66%，预计到 2026 年底将达到 88%。
#ai-agents评分 6.0
Google DeepMind News·6月25日 00:30 UTC
Gemini 3.5 Flash 内置计算机使用
Google 表示，computer use 现在已经成为 Gemini 3.5 Flash 的内置工具，取代了此前独立的 Gemini 2.5 computer use 模型。开发者现在可以直接用主力 Flash 模型构建能够在浏览器、移动设备和桌面环境中看、推理并执行操作的代理。
#ai-agents评分 8.0
The Decoder·6月24日 17:32 UTC
Anthropic 在 Slack 推出 Claude Tag
Anthropic 推出了 Claude Tag，这是一项 Slack 集成功能，允许用户在频道中直接 @Claude 来分配任务。公司表示，其内部版本已经为产品团队生成了 65% 的代码，而这项新功能目前已向 Claude Enterprise 和 Team 客户开放测试版。
#ai-agents评分 8.0
TechCrunch AI·6月24日 07:30 UTC
MoEngage收购Aampe，押注AI代理营销
MoEngage 已以全现金方式收购旧金山初创公司 Aampe，目标是围绕为单个客户决策的 AI 代理来构建营销体系。双方没有披露交易金额，但 TechCrunch 报道称，这笔交易价值数千万美元。
#ai-agents评分 6.0
TechCrunch AI·6月23日 04:53 UTC
Boris Cherny：AI 编码循环是下一步
在 Meta 的 @Scale 大会上，Claude Code 创作者 Boris Cherny 表示，AI“循环”是真实存在的，并且是软件开发的下一次重大转变。他描述的是一种让一个代理去提示另一个代理、持续改进代码的工作方式，而不是只做一次性的代理式编码。
#ai-agents评分 6.0
The Decoder·6月20日 17:51 UTC
Data2Story将CSV变成可验证新闻文章
牛津大学和斯坦福大学的研究人员开发了 Data2Story，这是一项 Claude Code 技能，依靠七个专门的 AI 智能体把 CSV 文件转换成交互式新闻文章。该系统会生成叙事文本、图表和背景信息，并内置 Inspector 面板，将可见的结论和素材追溯到代码、数据或外部来源。
#ai-agents评分 7.0
Cloudflare AI·6月18日 03:35 UTC
Cloudflare 将 Flue 加入代理支架栈
Cloudflare 表示，2026 年将是代理支架进入生产环境的一年，并把 Project Think 中验证过的生产加固能力带入 Cloudflare Agents SDK。与此同时，它推出了来自 Astro 团队的开源框架 Flue，作为第一个建立在该平台层之上的框架。
#ai-agents评分 7.0
Ars Technica AI·6月18日 03:25 UTC
AI代理自动化机器人训练硬件任务
NVIDIA GEAR 研究人员联合卡内基梅隆大学和加州大学伯克利分校的合作者，推出了 ENPIRE，这是一种让 AI 编码代理能够自主设计机器人训练方案的代理框架。借助它，代理们教会了机器人执行剪断扎带、将 GPU 插入主板插槽等任务。
#ai-agents评分 8.0
TechCrunch AI·6月16日 14:59 UTC
Respond.io 融资 6250 万美元扩展 AI 消息业务
总部位于马来西亚的 Respond.io 完成了由 Camber Partners 领投的 6250 万美元 B 轮融资，Endeavor Catalyst 和现有投资者也参与其中。公司表示其年度经常性收入已达到 3500 万美元，并且同比增长 169%，接下来将把这笔资金用于增长和并购。
#ai-agents评分 7.0
TechCrunch AI·6月15日 21:00 UTC
NewCore 获 6600 万美元打造 AI 代理身份管理
网络安全初创公司 NewCore 结束隐身并获得 6600 万美元融资，目标是为 AI 代理构建身份认证和访问控制能力。该轮融资由 Cyberstarts 领投，Index Ventures 和 Evolution Equity Partners 参与投资，投后估值达到 3 亿美元。
#ai-agents评分 7.0
The Decoder·6月13日 20:20 UTC
SkillOpt 用 Markdown 技能提升 GPT-5.5
微软与三所中国大学提出了 SkillOpt，这是一种把 AI 代理的指令文档当作可训练状态来优化的方法。报道中的结果显示，一个经过训练的 Markdown 技能文件让 GPT-5.5 在流程型任务上的表现提升了 20 多分。
#ai-agents评分 8.0
ZDNET AI·6月13日 17:00 UTC
Visa与OpenAI推进智能代理支付
Visa和OpenAI于周三宣布达成合作，将在OpenAI产品中支持代理式交易，包括Atlas和ChatGPT Shopping等界面。Visa表示，其Trusted Agent Protocol及其他安全层将允许开发者和商家在用户设定的控制条件下接受AI代理发起的支付。
#ai-agents评分 7.0
ZDNET AI·6月13日 00:14 UTC
企业若缺乏治理可能放弃AI代理
ZDNET报道，Gartner预计到2027年，40%的企业将降级或弃用自主AI代理，因为治理缺口往往要等到生产事故发生后才会暴露。文章还总结了Snowflake Summit上三位企业负责人的部署经验：使用框架、借助专家、以及让数据变现。
#ai-agents评分 6.0
ZDNET AI·6月12日 09:00 UTC
把AI代理当作需要严管的实习生
ZDNET 报道了在 Snowflake Summit 上的一场讨论，安全和 AI 领域的嘉宾认为，AI 代理应该像热情但容易跑偏的实习生一样被管理。讨论重点是为代理设置严格权限、明确目标，并在人类监督下让它们访问应用和数据。
#ai-agents评分 6.0
The Decoder·6月7日 18:28 UTC
Perplexity 让模型自己写搜索流水线
Perplexity 推出了“Search as Code”（SaC）架构，让 AI 模型生成自定义的 Python 搜索工作流，而不是调用固定的搜索 API。该系统正在 Perplexity Computer 和 Agent API 中逐步上线。
#ai-agents评分 7.0
The Decoder·6月6日 19:42 UTC
Meta 准备推出首款付费 AI 代理 Hatch
据报道，Meta 正在开发一款名为 Hatch 的付费 AI 代理，月费最高可能达到 200 美元。内部材料还显示，它会提供免费版和名为“Hatch Plus”的订阅层级，后者拥有高得多的使用额度，并计划在 7 月面向美国更广泛推出。
#ai-agents评分 7.0
TechCrunch AI·6月5日 03:20 UTC
Apple批准首个接入Messages for Business的AI代理
Poke成为首个获批在Apple的Messages for Business平台上运行的独立AI代理。这样一来，这家初创公司就能把iMessage加入其现有的短信、Telegram以及部分市场中的WhatsApp分发渠道。
#ai-agents评分 7.0
The Decoder·6月3日 21:40 UTC
Perplexity 推出本地云端混合 AI 路由
Perplexity 宣布了一套混合式 AI 编排系统，能够自动决定每个任务是在本地设备还是云端运行。该系统将从 7 月起集成到其 Always-on 代理产品 Personal Computer 中。
#ai-agents评分 7.0
TechCrunch AI·6月3日 21:40 UTC
Meta 的 Business Agent 全球上线 WhatsApp
Meta 周三表示，其客户支持机器人现已更名为 Meta Business Agent，并在 WhatsApp Business 中全球可用。该公司还将其扩展到 Instagram 私信，同时测试夜间聊天摘要和洞察等新功能。
#ai-agents评分 7.0
TechCrunch AI·6月3日 21:02 UTC
Coralogix 融资 2 亿美元布局 AI 代理监控
Coralogix 完成了 2 亿美元的 F 轮融资，投后估值达到 16 亿美元。公司表示，这笔资金将用于加速面向 AI 代理和其他自主软件系统的监控、排障和管理产品。
#ai-agents评分 7.0
The Decoder·6月3日 18:56 UTC
Nous Research 发布 Hermes Desktop 桌面 AI 代理
Nous Research 发布了 Hermes Desktop，这是一款采用 MIT 许可证的开源 AI 代理应用，目前已在 Windows、macOS 和 Linux 上开放公测。该应用把持久记忆、多应用通信、子代理委派和沙箱执行后端整合到一个跨平台桌面软件中。
#ai-agents评分 7.0
Ars Technica AI·6月3日 04:47 UTC
微软 Project Solara 面向 AI 代理
在 Build 2026 上，微软公布了 Project Solara，这是一个基于 Android 的概念操作系统，目标不是运行传统应用，而是运行 AI 代理。该系统被描述为一种芯片到云端的平台，围绕“即时生成界面”来按需创建交互界面。
#ai-agents评分 6.0
TechCrunch AI·6月3日 02:00 UTC
微软提出AI代理控制开放标准
微软推出了一个名为 Agent Control Specification（ACS）的开源标准，帮助开发者以更一致的方式管理 AI 代理行为。该规范通过策略文件定义代理可以做什么、禁止做什么、何时需要人工批准，以及必须记录哪些证据。
#ai-agents评分 8.0
The Verge AI·6月2日 20:38 UTC
Gemini Spark 的旅行规划既惊艳又令人不安
《The Verge》评测了谷歌新的常开式 AI 代理 Spark，发现它不仅能完成普通聊天任务，还能调用多种谷歌数据生成高度个性化的结果。在一次测试中，它根据 Gmail、Docs 等信息生成了非常详细的周末行程，而该功能目前已向谷歌每月 99 美元的 AI Ultra 订阅开放。
#ai-agents评分 7.0
The Verge AI·6月2日 04:00 UTC
Gemini Spark 表现惊艳但引发成本与隐私担忧
The Verge 的上手评测称，Google 新的 Gemini Spark AI agent 能代替用户完成相当复杂的多步骤任务，包括起草邮件、查找文件和更新日历。测试者发现它在很多时候确实像 Google I/O 上的演示一样出色，但仍不足以消除人们对成本和信任的担忧。
#ai-agents评分 7.0
The Decoder·5月31日 15:48 UTC
AI 搜索代理可能主要是在确认记忆
哈尔滨工业大学和小红书的研究人员发表的一项研究认为，领先的 AI 搜索代理往往依赖内部知识，而不是真正进行网页研究。研究团队还提出了 LiveBrowseComp，这是一个由近期、时效性很强的问题组成的新基准，理论上模型不应仅靠训练记忆就能答出。
#ai-agents评分 8.0
The Decoder·5月30日 17:32 UTC
Salesforce称AI代理将迁移从231天缩短到13天
Salesforce表示，已将整个软件开发组织迁移到由 Anthropic 的 Claude Code 驱动的代理式工作流，并向全公司开发者开放无限 token 使用。在一个 API 迁移案例中，公司称 AI 辅助工作流把原本估算需要 231 人日的工作缩短到了 13 天。
#ai-agents评分 8.0
The Decoder·5月29日 21:10 UTC
代码是AI代理的运行基底
来自 Meta、斯坦福大学和伊利诺伊大学厄巴纳-香槟分校的研究者发表了一篇综述论文，认为代码是 AI 代理进行推理、行动和协作的核心。论文同时强调了围绕模型的“harness”软件层，它能把无状态模型变成持续运行的代理系统。
#ai-agents评分 7.0
TechCrunch AI·5月29日 04:06 UTC
Asana 以 7500 万美元收购 StackAI
Asana 以 7500 万美元收购了无代码工作流自动化公司 StackAI。StackAI 的创始人 Tony Rosinol 和 Bernard Aceituno 将作为交易的一部分加入 Asana。
#ai-agents评分 6.0
TechCrunch AI·5月28日 23:35 UTC
Sesame推出对话式AI的iOS预览版
由Oculus创始人共同创立的AI初创公司Sesame，已经通过一款新的iOS应用发布了其对话式AI代理的公开预览版。该应用推出了四个代理——Maya、Miles、Simone和Charlie——它们可以边搜索边组织回答，而不是等全部完成后再开口回应。
#ai-agents评分 6.0
The Decoder·5月28日 01:42 UTC
Robinhood开放AI代理交易和刷卡消费
Robinhood正在推出一项测试版功能，允许Anthropic的Claude或Cursor等AI代理通过Model Context Protocol（MCP）连接到一个独立的投资账户。这些代理可以读取投资组合数据，并在当前测试版中代用户买卖股票；同时还可以连接一张虚拟的Robinhood信用卡，用于购买机票或餐厅预订等消费。
#ai-agents评分 8.0
The Decoder·5月23日 18:17 UTC
阿里 Qwen3.7-Max 自主运行 35 小时优化芯片代码
阿里巴巴的 Qwen 团队发布了 Qwen3.7-Max，这是一款面向长时间代理任务的专有模型，只能通过阿里云 Model Studio API 使用。在一次演示中，它在阿里自家的 T-Head-ZW-M890 加速器平台上，连续自主优化硬件注意力内核长达 35 小时。
#ai-agents评分 8.0
The Decoder·5月21日 02:48 UTC
DeepSeek打造代码智能体对标Claude Code
据报道，DeepSeek正在打造一款名为“Deepseek Code”的新代码智能体，并在北京组建专门的“Harness”团队从零开始开发。该项目旨在把模型研究与智能体能力结合起来，包括工具调用、规划和记忆。
#ai-agents评分 7.0
The Verge AI·5月20日 21:24 UTC
谷歌押注自己能让 AI 代理真正有用
《The Verge》称，谷歌在 I/O 2026 上推出了新一轮 AI 代理攻势，包括面向消费者的 Gemini Spark、Daily Brief 功能，以及更广泛的谷歌内部和外部服务集成。谷歌表示，部分功能本周开始推出，另一些则会在未来几个月陆续上线。
#ai-agents评分 8.0
The Verge AI·5月20日 01:45 UTC
谷歌推出 Gemini Spark AI 代理
谷歌在 I/O 2026 上发布了 Gemini Spark，这是一款由 Gemini 3.5 Flash 驱动的常驻 AI 代理。它可以在后台持续运行，连接 Google Workspace，并通过模型上下文协议（MCP）扩展到第三方应用。
#ai-agents评分 8.0
Cloudflare AI·5月19日 21:00 UTC
Claude 代理接入 Cloudflare 沙盒
Cloudflare 和 Anthropic 宣布了一项集成，使 Claude Managed Agents 可以运行在 Cloudflare Sandboxes 中。开发者可以把 Claude 的代理循环保留在 Anthropic 平台上，同时用 Cloudflare 负责代码执行、工具调用、连接能力和可观测性。
#ai-agents评分 7.0
The Decoder·5月17日 16:30 UTC
四个 AI 模型运营电台六个月
Andon Labs 进行了一项为期六个月的实验，让 Claude、GPT、Gemini 和 Grok 在相同条件下分别自主运营自己的电台。它们只有 20 美元预算，并且可以完全控制节目编排、与听众互动和自行寻找赞助。
#ai-agents评分 6.0
The Decoder·5月17日 15:39 UTC
OPPO开源端侧Android AI代理X-OmniClaw
OPPO的Multi-X团队开源了X-OmniClaw，这是一个Android AI代理，可以利用摄像头、屏幕和语音在多个应用中执行任务，而且直接运行在实体手机上。该系统以本地运行为主，只有在需要更高层次推理时才会调用云端模型。
#ai-agents评分 7.0
The Decoder·5月16日 17:55 UTC
OpenClaw 运行 100 个 AI 代理，月账单达 130 万美元
OpenClaw 创始人 Peter Steinberger 表示，他的团队在云端运行大约 100 个 Codex 实例，用于写代码、审查拉取请求、发现漏洞和分析安全问题。他称 OpenAI API 在 30 天内的账单达到 130 万美元，消耗了 6030 亿个 token 和 760 万次请求。
#ai-agents评分 8.0
TechCrunch AI·5月14日 05:45 UTC
Notion 将工作区变成 AI 代理枢纽
Notion 发布了一个开发者平台，让团队能够构建和协调 AI 代理，连接外部代理，并在工具和数据库之间创建多步骤工作流。它还推出了 Workers、数据库同步和 External Agent API 等新能力。
#ai-agents评分 7.0
OpenAI News·5月13日 19:00 UTC
OpenAI 为 Codex 打造 Windows 沙箱
OpenAI 发布了一篇技术说明，介绍它如何为 Codex 构建一个安全的 Windows 沙箱。这个沙箱旨在让编码代理在受控的文件访问和网络限制下运行。
#ai-agents评分 7.0
Hugging Face Blog·5月11日 02:44 UTC
MachinaCheck 在 AMD MI300X 上自动化 CNC 可制造性检查
MachinaCheck 是一个多智能体 AI 系统，它会分析 STEP 文件以及材料、公差和螺纹要求，并在大约 30 秒内生成可制造性报告。该系统在 AMD Instinct MI300X 上本地运行 Qwen 2.5 7B Instruct，因此客户几何数据不会离开工厂环境。
#ai-agents评分 6.0
OpenAI News·5月8日 20:30 UTC
OpenAI 如何安全运行 Codex
OpenAI 发布了一篇技术说明，介绍它如何通过沙箱、审批流程、网络策略和面向智能体的遥测来安全运行 Codex。文章详细说明了 OpenAI 如何通过这些运行控制，把编码智能体限制在明确边界内，同时保留有用的开发自动化能力。
#ai-agents评分 7.0
TechCrunch AI·5月8日 03:57 UTC
Perplexity 向所有 Mac 用户开放 Personal Computer
Perplexity 已通过新的桌面应用将 Personal Computer 功能向所有 Mac 用户开放。该功能此前仅限 Perplexity Max 订阅用户并需要排队等候，而现在仍然需要 Pro 或 Max 订阅才能使用。
#ai-agents评分 7.0
The Decoder·5月7日 18:59 UTC
Anthropic 为 Claude 托管代理加入“Dreaming”
Anthropic 正在为 Claude 托管代理新增“Dreaming”研究预览，同时将 Outcomes 和多代理编排推向公开测试版。Dreaming 允许代理回顾之前的会话并改进记忆，从而从反复出现的错误和成功流程中学习。
#ai-agents评分 7.0
Ars Technica AI·5月7日 00:15 UTC
Anthropic 为 Claude 托管代理加入“梦境”功能
Anthropic 在旧金山举行的 Code with Claude 开发者大会上，为 Claude 托管代理推出了一个名为“dreaming（梦境）”的研究预览功能。该功能会定期回顾最近会话，筛选有用记忆，并可更新代理的记忆库，以改进后续任务表现。
#ai-agents评分 7.0
The Decoder·5月6日 20:53 UTC
谷歌和Meta追赶个人AI代理
谷歌和Meta都在测试面向日常任务的个人AI代理，试图追赶Anthropic、OpenAI和微软。谷歌据称已经关闭Project Mariner，并在开发代号为Remy的新内部代理；Meta则在打造Hatch以及一个面向Instagram的购物代理。
#ai-agents评分 7.0
Simon Willison·5月6日 06:14 UTC
AI 在斯德哥尔摩经营咖啡馆
Andon Labs 在瑞典斯德哥尔摩启动了一项新的 AI 经营咖啡馆实验，延续了他们此前在旧金山做过的 AI 经营零售店测试。这个项目已经出现了一些有趣又离谱的运营决策，例如咖啡馆明明没有炉灶，AI 主管却下单买了鸡蛋，还用自己生成的草图去申请室外座位许可。
#ai-agents评分 7.0
TechCrunch AI·5月5日 22:07 UTC
CopilotKit 融资 2700 万美元推进应用内 AI 代理
CopilotKit 已完成一轮 2700 万美元的 A 轮融资，由 Glilot Capital、NFX 和 SignalFire 领投。该公司正扩展其 AG-UI 协议和企业工具包，帮助开发者在应用内部署具备交互式、应用专属界面的 AI 代理。
#ai-agents评分 7.0
ZDNET AI·5月5日 17:00 UTC
AI 代理成本高度不稳定
一项由密歇根大学的 Longju Bai 领衔、并联合斯坦福、DeepMind、Microsoft、MIT 和 All Hands AI 的新研究发现，AI 代理消耗的 token 远远高于普通聊天提示。研究人员指出，即使是同一个模型在同一任务上，代理的 token 使用量也高度波动，而且很难预测。
#ai-agents评分 7.0
ZDNET AI·5月4日 22:09 UTC
AI 代理激增推动代理管理平台兴起
ZDNET 报道称，企业中的 AI 代理数量正在快速增长，文中援引 Statista 的数据指出，全球目前有 2860 万个活跃代理，预计到 2030 年将超过 22 亿个。为应对这一趋势，一类新的代理管理平台正在出现，用于管理、协调和治理这些代理。
#ai-agents评分 6.0
The Verge AI·5月1日 19:18 UTC
微软推出Word法律代理AI用于合同审查
微软在Word中推出了名为Legal Agent的专用AI代理，专为法律团队设计，可基于真实法律实践的结构化流程逐条审查合同。它直接集成到Copilot中，帮助识别风险、遵守内部规范并建议修改，但不会取代人类判断。
#ai-agents评分 8.0
TechCrunch AI·5月1日 01:15 UTC
Stripe推出Link数字钱包，让AI代理安全处理支付
Stripe推出了Link数字钱包，使自主AI代理能够在不访问用户原始支付凭证的情况下代表用户进行购买。它支持基于OAuth的授权，并提供虚拟卡或共享支付令牌（SPT）以实现安全、可编程的支出。
#ai-agents评分 9.0
Cloudflare AI·4月30日 21:00 UTC
Cloudflare代理现在可自动完成完整部署设置
Cloudflare现在允许AI代理自主创建账户、购买订阅、注册域名并生成API令牌，从而立即部署代码——无需用户进行任何手动操作。
#ai-agents评分 9.0
TechCrunch AI·4月27日 21:08 UTC
OpenAI 或将推出以AI代理为核心功能的智能手机
OpenAI 正在开发一款用 AI 代理取代传统应用的智能手机，与联发科、高通和立讯精密合作打造。该设备将采用定制芯片，并结合本地和云端模型来持续理解用户情境。
#ai-agents评分 9.0
Google AI Blog·4月27日 21:00 UTC
谷歌与Kaggle将于2026年6月推出免费AI代理Vibe编码课程
谷歌与Kaggle将于2026年6月15日至19日举办为期五天的免费AI代理强化课程，重点教授如何使用自然语言工作流和实践项目构建可投入生产的AI代理。
#ai-agents评分 7.0
The Decoder·4月26日 16:12 UTC
研究人员称AI代理扩展了软件工程，远超代码范畴
来自查尔姆斯理工大学和沃尔沃集团的研究人员表示，AI代理并未取代软件工程师，而是将该领域扩展到了提示、工作流和决策流程等‘半可执行产物’。他们提出了一个名为‘半可执行栈’的六层模型来描绘这一扩展范围。
#ai-agents评分 8.0
TechCrunch AI·4月26日 05:43 UTC
Anthropic测试AI代理在真实市场中交易
Anthropic开展了一个名为“Project Deal”的试点实验，让AI代理作为买家和卖家在真实市场中完成交易，总成交额超过4000美元。研究发现，即使用户未察觉差异，更先进的模型仍能带来更好的结果。
#ai-agents评分 8.0
The Decoder·4月24日 01:20 UTC
谷歌开源 DESIGN.md 格式，助力AI生成品牌一致的设计
谷歌开源了 DESIGN.md 格式，这是一种可被机器读取的 Markdown 文件，用于在跨平台项目中保持 UI 的一致性。该格式包含 YAML 格式的视觉参数（如颜色和字体）以及说明文字，帮助 AI 理解设计意图。
#ai-agents评分 8.0
The Verge AI·4月23日 04:09 UTC
OpenAI推出可定制的企业级AI代理工具
OpenAI现在向商业、企业、教育和教师计划用户提供基于云的“工作区代理”，这些代理可以自动执行任务，例如在Slack中发送报告或在Gmail中起草邮件。
#ai-agents评分 9.0
The Decoder·4月23日 02:23 UTC
OpenAI发布工作区代理，让ChatGPT成为团队自动化平台
OpenAI在ChatGPT中推出了由Codex驱动的工作区代理，这些代理能自主处理复杂的多步骤团队任务，访问文件、工具和Slack等系统。它们在具有持久记忆的独立工作空间中运行，即使用户离线也能继续执行任务。
#ai-agents评分 9.0
OpenAI News·4月22日 18:00 UTC
OpenAI 推出基于 Codex 的团队工作区代理
OpenAI 推出了 ChatGPT 中的“工作区代理”，这些基于 Codex 的云端 AI 代理可自动执行复杂的团队任务，并在用户离线时仍持续运行。
#ai-agents评分 9.0
OpenAI News·4月22日 18:00 UTC
利用 WebSocket 加速代理工作流的响应 API
OpenAI 提出了一种新方法，通过使用 WebSocket 和连接作用域缓存来减少代理工作流中的 API 开销和模型延迟，特别是在 Codex 代理循环中。
#ai-agents评分 8.0
MIT Technology Review AI·4月22日 04:45 UTC
AI代理编排推动多代理工作流
AI代理正从单任务工具演变为能够处理复杂多步骤工作流的协同团队。Anthropic的Claude Code和OpenAI的Codex等新平台使多个专业代理能协作完成编程、研究和办公自动化等任务。
#ai-agents评分 8.0
TechCrunch AI·4月22日 03:11 UTC
AI实验室NeoCognition完成4000万美元融资，致力于打造类人自主学习智能体
前俄亥俄州立大学教授Yu Su创立了NeoCognition，这是一家开发类人自主学习智能体的初创公司。该公司已获得4000万美元种子轮融资，投资方包括Cambium Capital、Walden Catalyst Ventures和Vista Equity Partners。
#ai-agents评分 8.0
ZDNET AI·4月22日 02:01 UTC
扩展代理型AI需要可信数据与流程重塑
企业必须优先考虑高质量、可访问的数据并重新设计工作流程，才能有效扩展代理型AI。麦肯锡报告指出，全球近三分之二的企业已尝试使用AI代理，但不到10%实现了规模化价值。
#ai-agents评分 8.0
Simon Willison·4月22日 00:39 UTC
AI代理过于人性化——这反而成了问题
安德烈亚斯·帕尔松-诺蒂尼指出，当前的AI代理表现出令人沮丧的人类特质，如缺乏严谨性、耐心和专注力，这些特质阻碍了它们的可靠性和表现。
#ai-agents评分 8.0
ZDNET AI·4月21日 21:59 UTC
Moonshot AI 的 Kimi K2.6 使用 1000 个智能体自主处理复杂任务
Moonshot AI 发布了 Kimi K2.6，这是一个开源模型，可使用多达 1000 个协作的 AI 智能体自主执行长时间编码任务。它在 10 小时内构建了一个完整的 SysY 编译器，并为洛杉矶 30 家餐厅创建了着陆页而无需人工干预。
#ai-agents评分 9.0
The Decoder·4月21日 01:13 UTC
开源模型Kimi K2.6通过代理群组挑战GPT-5.4和Claude Opus 4.6
Moonshot AI发布了开源的Kimi K2.6模型，该模型可通过名为“代理群组”的系统并行运行多达300个子代理，从而自主完成生成网站、文档和电子表格等复杂任务。
#ai-agents评分 9.0
The Decoder·4月20日 22:39 UTC
Adobe推出CX企业AI平台以应对人工智能冲击
Adobe推出了CX Enterprise平台，这是一个基于AI代理的系统，旨在自动化营销、销售和客户互动任务。该平台与包括OpenAI、微软和英伟达在内的30多家AI合作伙伴集成。
#ai-agents评分 8.0
The Decoder·4月20日 21:11 UTC
Salesforce推出“Agent Albert”以应对AI颠覆企业软件的担忧
Salesforce推出了名为“Agent Albert”的新AI代理，预计今年底发布，并引入了“智能工作单元”（AWU）这一指标来衡量AI在企业生产力中的实际影响。
#ai-agents评分 8.0
Cloudflare AI·4月20日 21:00 UTC
Cloudflare推出面向AI代理的智能云工具
Cloudflare在2026年代理周上发布了一系列新基础设施原语，包括用于隔离代理执行的Sandboxes、用于Git兼容版本化存储的Artifacts，以及增强版Durable Objects以支持有状态代理应用。这些工具旨在支持大量并行AI代理同时运行。
#ai-agents评分 9.0
Simon Willison·4月20日 05:46 UTC
无头服务正成为个人AI的未来
文章指出，无头服务（如API、命令行工具和MCP协议）正成为个人AI代理的关键，因为它们比传统的GUI交互更快更可靠。Salesforce推出了Headless 360，将其整个平台作为API和CLI命令暴露给AI代理。
#ai-agents评分 8.0
The Decoder·4月19日 15:55 UTC
VisionClaw AI代理让雷朋Meta眼镜加速日常任务完成
科罗拉多大学、光州科学技术院和谷歌的研究人员开发了VisionClaw，这是一个始终在线的AI代理，运行在雷朋Meta眼镜上，结合实时环境感知与自主数字任务执行，利用浏览器、邮件和日历等工具。
#ai-agents评分 8.0
The Decoder·4月19日 15:16 UTC
谷歌发布A2UI 0.9，推动AI代理生成式用户界面
谷歌发布了A2UI 0.9，这是一个与框架无关的标准，使AI代理能够动态使用现有应用组件在网页、移动设备及其他平台上生成用户界面。
#ai-agents评分 9.0
The Decoder·4月18日 21:06 UTC
Salesforce首席执行官称API是AI代理的新界面
Salesforce首席执行官马克·贝尼奥夫表示，API正在取代传统用户界面，成为AI代理与企业系统交互的主要方式。该公司通过‘无头360’平台实施这一愿景，该平台通过API、MCP（模型上下文协议）和命令行界面（CLI）暴露Agentforce和Slack等工具。
#ai-agents评分 9.0
Cloudflare AI·4月17日 21:05 UTC
Cloudflare推出网站AI代理就绪评分工具
Cloudflare推出了isitagentready.com，这是一个评估网站与AI代理兼容性的新工具，并引入了一个数据集来追踪整个互联网上代理标准的采用情况。
#ai-agents评分 8.0
Cloudflare AI·4月17日 21:00 UTC
Cloudflare推出Agent Memory，实现AI代理持久记忆
Cloudflare推出了Agent Memory的私有测试版，这是一个托管服务，能让AI代理在不占用上下文窗口的情况下存储和检索有用信息。它通过隔离的资料档案实现记忆的摄入、检索和回忆操作。
#ai-agents评分 9.0
Ars Technica AI·4月17日 02:30 UTC
OpenAI Codex新增后台电脑使用功能，可自主执行任务
OpenAI的新版Codex桌面应用现在允许AI在后台执行任务——通过自己的光标进行查看、点击和输入，且不会干扰用户的当前工作。它还支持计划未来任务，并内置网页浏览器以实现交互式反馈。
#ai-agents评分 9.0
Cloudflare AI·4月16日 22:00 UTC
Cloudflare推出统一AI推理层以支持智能体应用
Cloudflare推出了一个统一的AI推理层，开发者可通过单一API在超过70个来自12家以上提供商的模型之间动态切换。该平台支持Workers和REST API，并具备成本监控、自动重试和元数据标记等功能，用于精细化追踪使用情况。
#ai-agents评分 9.0
Cloudflare AI·4月16日 21:00 UTC
Cloudflare AI搜索：AI代理的统一检索原语
Cloudflare发布了AI搜索（前身为AutoRAG），这是一种可即插即用的搜索原语，支持AI代理的混合语义和关键词检索。它现在包含内置存储、按代理或客户动态创建实例，以及基于元数据的排名优化。
#ai-agents评分 9.0
Cloudflare AI·4月16日 14:00 UTC
Cloudflare邮件服务进入公开测试，专为AI代理设计
Cloudflare推出了其邮件服务的公开测试版，开发者可以利用邮件作为通用通信渠道构建基于代理的工作流。新功能包括已进入公开测试的邮件发送、邮件路由以及带有原生邮件钩子的代理SDK。
#ai-agents评分 8.0
TechCrunch AI·4月16日 01:24 UTC
印度初创公司Emergent推出Wingman AI代理，实现消息驱动的任务自动化
印度初创公司Emergent推出了Wingman——一个基于消息平台（如WhatsApp和Telegram）的自主AI代理，可跨工作流处理日常任务。
#ai-agents评分 8.0
Cloudflare AI·4月15日 21:00 UTC
Cloudflare将浏览器渲染重命名为Browser Run以支持AI代理
Cloudflare将浏览器渲染服务更名为Browser Run，并新增了实时视图、人工介入、Chrome开发者工具协议（CDP）接口、MCP客户端支持和WebMCP集成等功能，使AI代理能够全面控制浏览器会话。
#ai-agents评分 8.0
Cloudflare AI·4月15日 21:00 UTC
Cloudflare发布Project Think，打造持久运行的AI代理
Cloudflare推出了Project Think，这是一个全新的AI代理SDK，包含持久执行、子代理、持久会话和沙盒代码执行功能，使AI能够执行复杂且长时间的任务，而不仅仅是编写代码。
#ai-agents评分 9.0
TechCrunch AI·4月15日 21:00 UTC
Gitar融资900万美元，用AI代理解决代码验证问题
由Ali-Reza Adl-Tabatabai创立的Gitar公司从秘密状态中现身，并获得了900万美元融资，旨在利用AI代理来验证和管理软件开发流程中的代码质量。
#ai-agents评分 8.0
Cloudflare AI·4月15日 21:00 UTC
Cloudflare为Agents SDK新增语音功能，支持实时交互
Cloudflare发布了其Agents SDK的实验性语音管道，使用户能够在与文本提示相同的代理架构中进行实时语音交互。新包@cloudflare/voice支持完整对话代理和仅语音转文字的使用场景，可通过React钩子或无框架依赖的客户端实现。
#ai-agents评分 8.0
Cloudflare AI·4月14日 21:00 UTC
Cloudflare Mesh：为AI代理提供安全私有网络连接
Cloudflare推出了Cloudflare Mesh，这是一种专为AI代理设计的新型私有网络解决方案，无需依赖传统的VPN或SSH隧道即可实现安全自动访问。它可与现有的Cloudflare One零信任架构无缝集成，为自主代理提供私有资源的安全访问。
#ai-agents评分 9.0
TechCrunch AI·4月14日 03:05 UTC
微软正在开发类似OpenClaw的本地AI代理，面向企业用户
微软正在测试一款受OpenClaw启发的本地运行AI代理，专为企业客户设计，并集成到Microsoft 365 Copilot中。该代理将能自主运行并执行多步骤任务，相比开源版本具有更好的安全性。
#ai-agents评分 8.0
OpenAI News·4月13日 14:00 UTC
Cloudflare将OpenAI的GPT-5.4和Codex集成到Agent Cloud中
Cloudflare已将其Agent Cloud平台接入OpenAI最新模型GPT-5.4和Codex，使企业能够以更高的速度和安全性构建并扩展用于实际任务的AI代理。
#ai-agents评分 9.0
The Decoder·4月12日 18:32 UTC
AI代理技能在现实条件下表现不佳
一项测试了34,198个真实技能的研究发现，当AI代理必须独立查找并应用这些技能时，其表现明显下降，尤其是在更接近现实的场景中。
#ai-agents评分 8.0
TechCrunch AI·4月10日 01:20 UTC
布雷特·泰勒：点击式软件时代即将终结
Sierra的CEO布雷特·泰勒推出了Ghostwriter工具，该工具能根据自然语言提示自动创建AI代理来替代传统的点击式软件界面。这标志着企业应用中向语言驱动任务执行的转变。
#ai-agents评分 8.0
The Decoder·4月9日 17:16 UTC
Anthropic推出自主AI代理的托管基础设施
Anthropic推出了名为‘Claude托管代理’的公开测试版，开发者无需自行管理基础设施即可构建和运行自主AI代理。早期用户包括Notion、Rakuten和Sentry，分别用于任务委派、企业自动化和调试。
#ai-agents评分 9.0
TechCrunch AI·4月9日 05:05 UTC
Poke让AI代理像发短信一样简单
Poke推出了一款新的AI代理，可通过iMessage、短信、Telegram和WhatsApp（部分区域）发送文字消息完成日程管理、智能家居控制和健康追踪等现实任务。用户只需访问Poke.com并输入手机号即可使用，无需安装任何应用。
#ai-agents评分 8.0
TechCrunch AI·4月9日 00:01 UTC
Astropad 推出 Workbench 工具，专为管理 AI 代理设计
Astropad 推出了 Workbench，这是一个专为管理运行在苹果设备（如 Mac Mini）上的 AI 代理而设计的远程桌面应用。它包含高保真流媒体、通过苹果语音模型进行语音输入，并支持 iPad 和 iPhone 多设备访问。
#ai-agents评分 8.0
Hugging Face Blog·4月8日 22:27 UTC
ALTK-Evolve 让 AI 代理从经验中学习可复用的原则
ALTK-Evolve 引入了一个记忆系统，从代理轨迹中提取可复用的指导原则，而不是重复阅读日志，使代理能够在不增加上下文大小的情况下泛化并持续改进。
#ai-agents评分 9.0
MIT Technology Review AI·4月7日 22:00 UTC
企业必须围绕AI代理重新设计工作流程
企业必须从将AI代理嵌入旧系统转向围绕它们重新设计整个工作流程。这种以代理为中心的方法可借助生成式AI实现自主和自适应的过程优化。
#ai-agents评分 8.0
The Decoder·4月3日 19:38 UTC
Claude AI现在可直接控制Mac和Windows桌面
Anthropic推出了一项研究预览功能，允许其Claude AI直接控制用户的Mac和Windows桌面，包括打开应用程序、浏览网页和填写电子表格。该功能现已对Pro和Max用户开放，可在Windows版的Claude Code和Claude Cowork中使用，此前仅限于macOS。
#ai-agents评分 9.0
OpenAI News·4月1日 10:00 UTC
Gradient Labs为每位银行客户推出AI账户经理
Gradient Labs部署了GPT-4.1和GPT-5.4 mini/nano模型，驱动自主AI代理处理银行支持工作流，具有低延迟和高可靠性。
#ai-agents评分 8.0
The Decoder·3月29日 22:45 UTC
MetaClaw利用谷歌日历在空闲时段训练AI代理
MetaClaw是一个框架，通过自动生成行为规则并利用强化学习在用户空闲时段（由谷歌日历、键盘活动和睡眠时间检测）更新模型权重，使AI代理能够从错误中学习。
#ai-agents评分 8.0
Simon Willison·3月28日 20:04 UTC
马特·韦伯谈代理编码的局限性
马特·韦伯批评代理编码倾向于通过暴力迭代（如无限使用while循环）解决问题，即使代价是消耗海量计算资源。他指出真正的目标应该是可维护、可组合且具有架构意识的AI驱动软件开发。
#ai-agents评分 8.0
Ars Technica AI·3月25日 05:37 UTC
Mozilla开发者推出'cq'，打造AI代理的Stack Overflow
Mozilla开发者彼得·威尔逊推出了名为'cq'的项目，旨在为AI代理创建一个类似Stack Overflow的集中式知识库，解决代理间因信息过时和重复解决问题而造成的低效问题。
#ai-agents评分 8.0