AI 日报

AI 代理、基础设施与平台安全成为 6 月 7 日焦点

今天的报道集中指向同一个主题:AI 正从“能聊天”进入“能行动、能接入系统、能影响商业结构”的阶段。与此同时,安全风险、监管想象和算力争夺也同步升温,显示出行业竞争正在从模型能力扩展到部署方式、平台控制权和基础设施掌握度。

当天导读

从 26 条资讯中筛选出 14 条

今天的报道集中指向同一个主题:AI 正从“能聊天”进入“能行动、能接入系统、能影响商业结构”的阶段。与此同时,安全风险、监管想象和算力争夺也同步升温,显示出行业竞争正在从模型能力扩展到部署方式、平台控制权和基础设施掌握度。

ChatGPT 安全开始从“拦截输入”转向“收紧外链”

OpenAI 的锁定模式表明,面对提示注入,现实可行的防线是减少外向请求和数据外泄路径,而不是幻想模型能完美识别所有恶意指令。

苹果与 Meta 都在重塑 AI 入口

苹果押注新版 Siri,把助手能力嵌入更多系统层;Meta 则把 AI 应用变成推荐流和故事流,显示平台争夺正从“聊天框”扩展到“默认信息入口”。

代理化正在从概念变成产品

阿里巴巴的 Qwen3.7-Plus、Meta 的 Hatch 传闻,以及 OpenAI/苹果的助手升级,都指向同一趋势:模型不再只是回答问题,而是直接执行任务。

算力与资本继续主导 AI 竞争

SpaceX 与谷歌的芯片大单和特朗普政府可能入股 OpenAI 的消息,都在说明 AI 行业的核心战场已从模型本身扩展到算力、治理与收益分配。

更强自动化也需要更强沙箱

从 Simon Willison 的 WASM 沙箱,到小模型多智能体模拟,工程层面的权限控制、隔离和路由,正在成为 AI 落地的关键能力。

今日主题

AI 行业今天的关键词是 “执行”:模型开始更像代理,产品开始更深地嵌入操作系统与社交信息流,而公司之间的竞争则越来越依赖算力、分发和安全边界。(#2329 #2333 #2337 #2327)

头条观察

OpenAI 为 ChatGPT 推出锁定模式,重点不是消灭提示注入,而是收紧外向网络请求,减少敏感数据被外传的路径。这说明 AI 安全治理正从“识别恶意输入”转向“限制可被利用的输出通道”。(#2329)

产品与平台:AI 入口之争升级

苹果围绕 WWDC 再次押注 Siri 重构,报道指向更强的上下文理解、多步骤任务和可能引入 Gemini 技术的新版助手;与此同时,Meta 也在把自家 AI 应用改造成带推荐流的内容入口,甚至开始批量生成点击诱饵式故事。(#2330 #2341 #2340)

代理化与自动化:模型开始“做事”

阿里巴巴的 Qwen3.7-Plus 强调 GUI 操作、云控制台任务和端到端软件构建,显示多模态模型正在从识别走向执行。Meta 的 Hatch 传闻则进一步表明,高价订阅 AI 代理正在被视为下一阶段的消费级变现路径。(#2333 #2337)

基础设施与资本:算力比模型更稀缺

SpaceX 与谷歌之间每月 9.2 亿美元级别的 AI 芯片合同,把算力、云容量和 IPO 叙事绑在一起;而特朗普政府可能考虑入股 OpenAI 的报道,则把“AI 财富如何分配”直接推上政治议程。(#2327 #2328)

研究与工程:更强代理,更强边界

Sakana AI 成立 RSI 实验室,继续探索 AI 自我改进能否成为超越单纯算力扩张的新路线;Simon Willison 则用 MicroPython + WASM 做沙箱执行,强调插件和智能体代码必须在权限上被严格限制。(#2336 #2335)

值得继续跟踪

  • OpenAI 的锁定模式会不会成为高风险企业用户的默认安全配置。(#2329)
  • 苹果是否真的会把 Siri 做成更独立、更代理化的系统。(#2330 #2341)
  • SpaceX/Google 大单对 Nvidia 芯片供需和 AI 基础设施价格的影响。(#2327)
  • Qwen3.7-Plus 这类多模态代理能否稳定跨越“演示强、落地弱”的门槛。(#2333)
  • AI 代理商业化是否会沿着 Meta 的高价订阅路线快速扩张。(#2337)

当日精选 8 条

01

Simon Willison

·#openai

OpenAI 推出 ChatGPT 锁定模式

OpenAI 已正式向符合条件的 ChatGPT 账户推出锁定模式,包括 Free、Go、Plus、Pro 以及自助版 ChatGPT Business 用户。该功能通过限制外向网络请求,降低由提示注入攻击导致的数据外泄风险。

对于会用 ChatGPT 处理敏感数据的个人和组织来说,这是一项重要的安全控制,尤其是在涉及不可信网页内容或文件时。它表明 OpenAI 正在为大语言模型最难防范的问题之一提供实用缓解手段:在模型接触到恶意指令后,阻止其把数据泄露出去。

OpenAI 推出了 Lockdown Mode,这是一项新的 ChatGPT 安全功能,目标是降低提示注入攻击在最后阶段导致数据外泄的风险。Simon Willison 指出,这个功能最早在 2 月被预告,如今已经正式上线,并开始向符合条件的个人账户以及自助版 ChatGPT Business 账户开放。根据 OpenAI 的说明,Lockdown Mode 通过限制可能把敏感信息传回攻击者的外向网络请求来发挥作用。公司表示,这项功能主要面向风险等级更高的用户和组织,例如处理敏感数据的人群。

OpenAI 也强调,Lockdown Mode 并不能彻底阻止提示注入,因为恶意指令仍可能出现在缓存网页内容或上传文件中,并继续影响模型的行为或回答准确性。换句话说,这个模式并不是消灭提示注入本身,而是降低攻击成功把数据外传的概率。Willison 认为,这一设计直接针对了他所说的“Lethal Trifecta”中的外泄环节,即私有数据、不可信内容和数据传输通道三者同时存在时的风险。OpenAI CISO Dane Stuckey 还表示,对于高风险用户而言,功能和可用性的部分牺牲是值得的。

锁定模式并不会阻止提示注入进入模型上下文;恶意指令仍可能出现在缓存网页内容或上传文件中,并影响回答。它的主要保护方式是禁用或限制实时网页浏览、网页图片检索、深度研究和 agent 模式,从而减少数据外泄路径。

查看单篇正文查看原文
02

TechCrunch AI

WWDC 2026前瞻:Siri大改版与Apple Intelligence

·#apple

WWDC 2026前瞻:Siri大改版与Apple Intelligence

TechCrunch 预览了 WWDC 2026,并称苹果预计会推出重大的 Siri 改版以及新的 Apple Intelligence 更新。报道还指出,升级后的 Siri 可能会使用 Google Gemini 技术,并可能配套推出一个独立的 Siri 应用。

如果苹果真的推出更强大的 Siri,这可能会改变用户与 iPhone、iPad、Mac 及其他苹果设备的交互方式。更紧密的 AI 助手和应用级集成,也会让苹果更直接地与 ChatGPT、Claude 和 Gemini 展开竞争。

TechCrunch 表示,WWDC 2026 很可能会以苹果新一轮 AI 功能为核心,其中最受关注的是 Siri。大会将于周一上午 10 点(太平洋时间)/ 下午 1 点(美国东部时间)开始,并可通过 Apple Developer app、苹果官网和 Apple Developer YouTube 频道观看直播。最受期待的变化,是 Siri 将迎来一次重大的改版,变得更像一个可以对话的助手,并且更擅长理解上下文。报道指出,这个新 Siri 预计可以处理多步骤请求,并且在不同应用和服务之间更自然地协同工作。文章还称,Siri 可能会借助 Google 的 Gemini 技术来增强能力。文中引用的 Bloomberg 爆料还显示,苹果可能会推出一个独立的 Siri 应用,以便与 ChatGPT、Claude 和 Gemini 等产品竞争。

另一个传闻功能是消息自动删除计时器,用户可以选择 30 天后删除、一年后删除,或者永不删除。除了 Siri 之外,苹果据称还计划在 App Store 中加入 AI agent 集成,让用户把预约、文档编辑和智能家居控制等任务交给 agent 完成。Camera 应用可能会新增一个专门的 Visual Intelligence 区域,而 Photos 可能会获得由 Apple Intelligence 驱动的场景建议、对象移除和自然语言编辑功能。Image Playground 也可能升级,带来更高质量的图像生成、更多风格、更好的角色一致性和更简单的编辑方式,同时还可能出现 Genmoji 和 AI 壁纸功能。Wallet 方面可能会加入账单分摊功能,以及把实体门票或会员卡转换为数字通行证的 Create a Pass 工具。苹果还预计会在 macOS、iPadOS、visionOS、watchOS 和 tvOS 上推出一些较小的 AI 与稳定性更新。

文章称,新 Siri 预计将具备理解上下文、处理多步骤任务以及更自然地跨应用和服务工作的能力。文中还提到了一些传闻功能,例如消息自动删除计时器、App Store 的 AI agent 支持,以及 Photos、Image Playground、Wallet 和其他平台的 Apple Intelligence 升级。

查看单篇正文查看原文
03

TechCrunch AI

特朗普或寻求美国入股 OpenAI

·#ai-policy

特朗普或寻求美国入股 OpenAI

TechCrunch 报道称,特朗普政府可能正在讨论持有 OpenAI 的股权,这一想法可能与该公司提出的 Public Wealth Fund 有关。特朗普还表示,他已与 AI 公司讨论过一些协议,希望让美国民众从 AI 的成功中受益。

如果美国政府持有 OpenAI 的股份,这将成为国家参与头部私营 AI 公司的一项重要先例。此举可能重塑 AI 行业的利润分配、治理结构以及公共收益的实现方式。

特朗普总统周五表示,他已经与一些 AI 公司讨论过交易方案,希望“美国人民能够从 AI 的成功中受益”。他并没有在讲话中点名具体公司,但在 CNBC 报道称特朗普政府确实在与 OpenAI 讨论股权安排后,OpenAI 成为了最可能的对象。CNBC 还称,这部分潜在股权中的一部分可能会用于为 OpenAI 新近提出的 Public Wealth Fund 提供初始资金。按照 OpenAI 的设想,该基金的收益可以直接分配给公民,让更多人即使没有资本市场投资基础,也能参与 AI 驱动的经济增长。Bloomberg 报道称,当记者在空军一号上问及这一想法时,特朗普表示他一直在与 AI 高管讨论一些“让美国公众分得一部分成果、让美国公众本质上成为公司伙伴”的概念。Bloomberg 还称,OpenAI 首席执行官 Sam Altman 自 2025 年初以来一直在讨论政府持有大型 AI 公司股份的可能性。

报道指出,这与特朗普更广泛支持政府持有营利性公司股权的思路一致,其中最典型的例子是政府去年持有了陷入困境的芯片制造商 Intel 10% 的股份。与此同时,这一想法也在左翼阵营获得了一些呼应,参议员 Bernie Sanders 本周提出,对 OpenAI、Anthropic 和 xAI 等公司征收一次性 50% 的股票税。Sanders 认为,这能让公众直接参与决定这项技术的未来,并确保 AI 可能创造的数万亿美元财富被用于改善所有人的生活。David Sacks 随后在社交媒体上表示,他理解为什么 Sanders 的提议会引发共鸣,但警告这会加速已经在发生的“企业与政府融合”。前微软员工 Dare Obasanjo 也在社交媒体上表示,政府救助 OpenAI 的铺垫似乎已经开始。

CNBC 称,部分潜在股权可能会用于启动 OpenAI 的 Public Wealth Fund;按照公司的设想,该基金的收益可直接分配给公民,让更多人分享 AI 驱动的增长。Bloomberg 报道称,Sam Altman 自 2025 年初起就一直在讨论政府持有大型 AI 公司股份的想法,而参议员 Bernie Sanders 则另行提出,对 OpenAI、Anthropic 和 xAI 等公司征收一次性 50% 的股票税。

查看单篇正文查看原文
04

The Decoder

SpaceX 与谷歌达成 IPO 前 AI 芯片大单

·#ai-infrastructure

SpaceX 与谷歌达成 IPO 前 AI 芯片大单

据报道,SpaceX 与谷歌签署了一份每月 9.2 亿美元的合同,涉及约 11 万颗 Nvidia AI 芯片的使用权。该协议从 2026 年 10 月持续到 2029 年 6 月,累计规模可能约为 300 亿美元。

这笔交易表明,AI 竞争越来越取决于算力、云容量和芯片获取,而不只是模型本身。它还把一家准备进行 IPO 的大型私营公司与一笔巨额 AI 基础设施协议联系起来,可能影响整个行业的供需关系。

据文章援引的 SEC 文件显示,SpaceX 与谷歌签署了一份每月 9.2 亿美元的合同。该协议的期限从 2026 年 10 月开始,到 2029 年 6 月结束,按此计算总收入可能约为 300 亿美元。根据协议,谷歌将获得约 11 万颗 Nvidia AI 芯片的使用权,以满足客户需求。谷歌云发言人对《纽约时报》表示,这是一项“短期、及时的协议”,目的是为 Gemini Enterprise 智能体平台提供过渡性的算力支持。

此事的时间点尤其引人关注,因为报道说 SpaceX 正准备在下周启动 IPO,估值可能超过 1.7 万亿美元。报道还提到,谷歌持有约 5% 的 SpaceX 股份,因此其在这次公开市场亮相中也有直接利益。文章将这笔交易视为更广泛趋势的一部分,即 SpaceX 正在扮演 AI 基础设施提供商,而不只是把算力留给内部使用。作者认为,这样做在商业上也合理,因为马斯克最初为自己的 AI 实验室 xAI 建设了这些能力,而 xAI 相比一些竞争对手进展较慢,因此把基础设施出租出去更有财务吸引力。

谷歌云将这项安排描述为一笔短期、及时的“桥接产能”交易,用于支撑其 Gemini Enterprise 智能体平台。该文件之所以重要,还因为谷歌持有约 5% 的 SpaceX 股份,而且 SpaceX 之前还与 Anthropic 达成过每月 12.5 亿美元的单独协议。

查看单篇正文查看原文
05

The Decoder

Qwen3.7-Plus推动多模态AI走向自主代理

·#multimodal-ai

Qwen3.7-Plus推动多模态AI走向自主代理

阿里巴巴发布了 Qwen3.7-Plus,这是一款基于 Qwen3.7 的新多模态模型,把视觉理解和代理能力结合在一起。该模型可以读取屏幕内容、操作图形界面和应用、根据视觉模板写代码,并在较少人工干预下完成端到端任务。

这次发布表明,多模态AI正在从图像识别走向实际的计算机操作和自主软件工作。如果阿里巴巴的说法成立,Qwen3.7-Plus 可能会对希望使用 GUI 自动化、云端操作和应用构建能力的开发者与企业很有价值。

阿里巴巴 Qwen 团队发布了 Qwen3.7-Plus,并将其描述为“多模态交互混合代理”。该模型建立在仅文本的 Qwen3.7 之上,把视觉感知与传统代理能力结合起来,包括编码和工具调用。阿里巴巴称,它可以识别真实世界场景、读取屏幕内容、操作图形界面、端到端地浏览手机应用,并在同一个代理循环中同时执行界面点击和命令行指令。团队展示的一个重要案例是,基于 Qwen3.7-Plus 的混合代理系统用超过 11 个小时构建了一个英语词汇学习应用。这个过程据称产生了超过 10,000 行代码,调用了 1,000 多次代理操作,并覆盖需求文档、自动代码生成、安装、测试用例创建、基于 GUI 的测试、并行测试场景以及版本管理。第二个演示中,代理通过解析 UI 结构,自主复刻了原生 macOS Stocks 应用,生成了 SwiftUI 代码,接入实时股票数据的外部 API,随后编译应用并自动运行了 10 个功能测试。

第三个用例展示了通过 “Qwen for Chrome” 侧边栏扩展实现的浏览器代理,该代理在获得用户许可后可进入代理模式,在云控制台中执行任务,例如购买最便宜的虚拟服务器实例,并进一步处理扩容和维护。阿里巴巴公布的基准测试表明,这个模型在 GUI 自动化方面尤其强,AndroidWorld 和 ScreenSpot Pro 上的表现领先,并声称在这些界面任务上优于 GPT-5.4(xhigh)、Opus 4.6 Max 和 Gemini 3.1 Pro 等模型。不过,在纯推理能力上,Qwen3.7-Plus 的结果没有那么一致,在 MedXpertQA-MM 这类更困难的科学基准上落后于部分竞争对手。与此同时,阿里巴巴表示它在文本任务上的表现与顶级模型大致相当。该模型通过阿里云 Model Studio 提供,并且是专有产品,没有开放权重,Plus 版本的定价也明显低于 Max 版本。

阿里巴巴称,该模型在 GUI 任务上表现突出,包括自主复刻原生 macOS Stocks 应用、连接股票 API、编译应用并自动运行测试。不过,它在更难的推理基准上表现不一,在界面操作上的优势明显强于科学题或纯逻辑任务。

查看单篇正文查看原文
06

Hugging Face Blog

Thousand Token Wood v2 打造多模型金融博弈

·#multi-agent-systems

Thousand Token Wood v2 打造多模型金融博弈

Hugging Face 的 Thousand Token Wood 从一个天气神沙盒升级成了可交互的金融剧情游戏,用户扮演“森林赞助人”。第二版还把原先的单一模型架构改成了来自不同实验室的四个小模型:gpt-oss-20b、MiniCPM3-4B、Nemotron-Mini-4B,以及作者自己微调的 Qwen 0.5B。

这个项目展示了如何把来自不同来源的小模型编排成一个可信的多智能体模拟,这对游戏、合成环境和代理式 AI 系统都很有参考价值。它还说明,真正棘手的往往不是模型本身,而是部署、路由和安全隔离等服务层问题。

Thousand Token Wood 的第一版是一个小型沙盒:五只林中生物在一个微调过的 0.5B 模型上交换商品,用户可以通过外部冲击来观察泡沫和崩盘如何出现。第二版把这个想法变成了一个真正可以操作的游戏,用户扮演“森林赞助人”,也就是一个暗中的金融掮客。玩家可以放贷、提供可能为真也可能是诱饵的提示、做空市场、贿赂角色,以及撮合联盟。与此同时,林中的角色会记住你之前如何对待它们,并据此回敬你;一个治安官则会追查你是否利用了不该知道的信息。最重要的架构变化是,每个角色现在都由不同实验室的不同小模型驱动,而不再共享一个模型。

系统中使用了 OpenAI 的 gpt-oss-20b、OpenBMB 的 MiniCPM3-4B、NVIDIA 的 Nemotron-Mini-4B,以及作者自己微调的 Qwen 0.5B。作者认为,这种多样性很重要,因为市场模拟之所以有趣,正是因为参与者彼此真正不同,而不是同一个模型换几段 prompt。把四个异构模型放到同一平台后,作者发现真正的难点主要在服务和集成层,而不是模型本身。比如,vLLM 0.22.1 需要 nvcc,因此必须使用带 CUDA 开发工具的镜像;gpt-oss-20b 在 L4 GPU 上以原生 MXFP4 量化运行;MiniCPM3 需要 trust_remote_code;而整个 prompt 与输出管线都必须能容忍各模型不同的格式习惯,才能让模拟稳定运行。

作者指出,最大的工程教训是摩擦主要来自服务层而不是建模层:vLLM 0.22.1 需要 CUDA 工具链支持,最初因为镜像里没有 nvcc 而全部失败,后来改成 CUDA devel 基础镜像才解决。模拟还依赖一个宽容的 JSON 解析与修复层,避免不同模型输出格式不规范时把游戏弄崩;此外,秘密提示的真伪标记完全不放进 prompt,并通过测试防止泄漏。

查看单篇正文查看原文
07

Simon Willison

用 MicroPython 和 WASM 运行沙箱化 Python 代码

·#webassembly

用 MicroPython 和 WASM 运行沙箱化 Python 代码

Simon Willison 发布了一个名为 micropython-wasm 的 alpha 版包,用 MicroPython 编译到 WebAssembly 后在沙箱中运行 Python 代码。他还把它用于新的 Datasette Agent 插件 datasette-agent-micropython,以实现受控代码执行。

这代表着让插件和智能体代码更安全运行的一个实际进展,用户提供的代码可以在文件、网络、CPU 和内存方面受到更严格的限制。对于构建可扩展 Python 应用的开发者来说,这很重要,因为它指向一种更便携的沙箱模型,而不只是依赖进程级隔离。

Simon Willison 说,他已经就沙箱化代码执行实验了好几年,而现在这套方案似乎最接近他一直在寻找的特性。 他把这个成果发布为一个名为 micropython-wasm 的 alpha 包,并且已经把它用在 Datasette Agent 的一个插件 datasette-agent-micropython 中。 他的动机来自 Datasette、LLM 和 sqlite-utils 这类大量依赖插件的项目。 这些插件虽然让软件可以快速扩展,但当前插件代码会在应用内部拥有完整权限。 这意味着有缺陷或恶意的插件可能破坏应用,或者泄露私有数据。

Willison 希望能在不允许未授权文件访问、网络访问或其他危险操作的情况下运行这类插件式代码。 他还希望同样的隔离能力也能用于 Datasette 的其他场景,例如 enrichments、定时运行的代码,以及把已批准的 JSON 处理成 SQLite 表行的小型任务。 他明确提出的要求包括:可以直接从 PyPI 干净安装、对内存和 CPU 有资源限制,以及限制文件访问。 这篇文章的核心观点是,WebAssembly 作为沙箱层很有前景,而 MicroPython 则提供了一个可以编译成 WASM 的轻量级 Python 运行时。

这个包目前仍处于 alpha 阶段,因此它还是一种早期方案,而不是已经完全加固的生产级沙箱。它采用了运行在 WebAssembly 中的 MicroPython,而相关的 PyPI 条目提到可以通过内存和 fuel 限制来执行,这说明资源控制是其设计的一部分。

查看单篇正文查看原文
08

The Decoder

Sakana AI成立RSI实验室探索自我改进AI

·#ai-research

Sakana AI成立RSI实验室探索自我改进AI

Sakana AI成立了“ Sakana AI RSI Lab ”,这是一个专注于递归自我改进(RSI)的新研究团队。该实验室将研究AI系统是否能够比当前依赖大规模算力扩展的方法,更快地帮助设计、优化和改进未来的AI系统。

如果这一方向成功,RSI 可能提供一种不完全依赖更大GPU集群来提升AI能力的路径,从而改变前沿模型的研发方式。这可能让先进AI研究更高效,也更有可能被大型实验室之外的团队接触到。

Sakana AI成立了“ Sakana AI RSI Lab ”,这是一个专注于递归自我改进(RSI)的新研究团队。该实验室将研究AI系统是否能够比当前依赖大规模算力扩展的方法,更快地帮助设计、优化和改进未来的AI系统。 如果这一方向成功,RSI 可能提供一种不完全依赖更大GPU集群来提升AI能力的路径,从而改变前沿模型的研发方式。

这可能让先进AI研究更高效,也更有可能被大型实验室之外的团队接触到。 Sakana表示,这项工作建立在 LLM-Squared、Darwin Gödel Machine、ShinkaEvolve、ALE-Agent 和 The AI Scientist 等项目之上。公司将通往 RSI 的路径分为四个阶段,最终目标是让智能体能够为自身底层架构编写、基准测试并验证代码。

Sakana表示,这项工作建立在 LLM-Squared、Darwin Gödel Machine、ShinkaEvolve、ALE-Agent 和 The AI Scientist 等项目之上。公司将通往 RSI 的路径分为四个阶段,最终目标是让智能体能够为自身底层架构编写、基准测试并验证代码。

查看单篇正文查看原文
09

The Decoder

Meta 准备推出首款付费 AI 代理 Hatch

·#ai-agents

Meta 准备推出首款付费 AI 代理 Hatch

据报道,Meta 正在开发一款名为 Hatch 的付费 AI 代理,月费最高可能达到 200 美元。内部材料还显示,它会提供免费版和名为“Hatch Plus”的订阅层级,后者拥有高得多的使用额度,并计划在 7 月面向美国更广泛推出。

这将是 Meta 的首款付费 AI 产品,意味着公司正从免费消费级 AI 功能转向直接变现。它也让 Meta 加入与 OpenAI、Anthropic 之间的高端 AI 代理竞争,同时把软件收入与公司不断扩张的 AI 硬件计划联系起来。

据报道,Meta 正在开发一款新的付费 AI 代理产品 Hatch,月费最高可能达到 200 美元。该系统被描述为 OpenClaw 的更易用版本,而 OpenClaw 是一款基于大语言模型执行任务的开源自主 AI 代理工具。报道指出,用户只需用简单语言描述需求,Hatch 就能生成可工作的工具,或者直接处理创建软件工具、安排约会和发送电子邮件等任务。内部文件似乎显示,Hatch 会同时提供免费版本和名为“Hatch Plus”的高级订阅层级,后者的使用额度是免费版的 5 到 10 倍。

若该产品落地,Meta 将直接进入高端 AI 产品竞争,和 OpenAI、Anthropic 展开对抗,而这两家公司的顶级订阅价格也被称为在每月 100 到 200 美元之间。报道还称,Hatch 计划在 7 月进行更广泛的美国上线。与此同时,Hatch 也将为 Meta 未来的 AI 硬件提供能力支持,包括带有“超感知”功能的新智能眼镜,以及预计在 2027 年春季进行内部测试的 AI 吊坠。文章将这一动向解读为 Mark Zuckerberg 寻找广告之外新收入来源的一部分,以支撑 Meta 高额的 AI 基础设施投入。

Hatch 被描述为开源工具 OpenClaw 的易用版,目标是根据自然语言需求生成可工作的工具,并处理日程安排和电子邮件等任务。报道称,相关硬件路线图还包括带有“超感知”功能的新智能眼镜,以及一款可能在 2027 年春季进入内部测试的 AI 吊坠。

查看单篇正文查看原文
10

The Decoder

xAI据报使用Claude输出训练模型

·#ai

xAI据报使用Claude输出训练模型

《The Information》报道称,xAI曾花费数月时间利用Anthropic的Claude输出来蒸馏训练自己的编码模型,直到Anthropic在1月切断官方访问。即便在被切断后,xAI工程师据称仍通过个人账号和中介服务Blackbox AI继续使用相关输出。

如果属实,这一报道凸显了模型蒸馏以及对竞争对手AI系统的访问,如何影响编码助手的竞争格局。它也引发了关于数据来源、平台规则,以及前沿AI实验室之间竞争强度的更广泛问题。

《The Information》报道称,埃隆·马斯克的xAI曾花费数月时间使用Anthropic的Claude输出训练自己的编码模型。报道指出,xAI并不是只依赖自身生成的数据,而是直接把Claude的回答拿来用于训练。Anthropic随后在1月撤销了官方访问权限,但据称xAI工程师仍通过个人账号以及Blackbox AI这一中介服务继续绕开限制。该报道把这一做法描述为前沿AI公司常见的竞争路径之一,即利用更强模型的输出加速自身系统的开发。文章还提到,马斯克此前在法庭上承认,xAI曾“部分”使用OpenAI模型训练Grok,并表示这属于行业标准做法。

除训练争议外,报道还称xAI内部似乎存在较大压力。其预训练团队据称已缩减到不到五人,而在几个月内有四位Grok代码负责人离职,同时还有许多联合创始人离开。报道还称,一名员工曾误删关键训练数据,导致团队损失了两到三周的工作。文章最后表示,马斯克此前采购的大量算力目前似乎更多被租给Anthropic(通过SpaceX)以及Google,而不是被充分用于xAI自身训练,不过这被描述为一种临时过渡方案。

该报道还称,马斯克此前在法庭上承认,xAI曾“部分”使用OpenAI模型训练Grok,并称这属于行业惯例。报道同时提到xAI内部存在不稳定迹象,包括预训练团队缩减、多个Grok代码负责人离职,以及一次误删关键训练数据、据称造成两到三周工作损失。

查看单篇正文查看原文
11

The Decoder

开源语音模型持续监听

·#voice-ai

开源语音模型持续监听

研究人员推出了一款开源的“Audio Interaction”模型,它会持续监听音频流,并每隔0.4秒判断一次是保持静默还是生成回复。该系统把对话、翻译、转录和声音识别整合到了一个30亿参数模型中。

这种方式让语音AI更接近真人的实时互动,因为它降低了延迟,并让模型能够主动响应语音和环境声音。对于需要在合适时机才发声的助手、实时翻译、转录和常开式音频系统来说,这可能很重要。

这篇报道介绍了一款名为“Audio Interaction”的开源语音模型,它不再像传统语音系统那样等整段录音结束后再处理,而是持续监听音频流。模型每隔0.4秒就会做一次判断,决定是输出<silent>继续倾听,还是输出<response>开始回应。研究人员希望把对话、翻译、转录和声音识别整合到同一个系统里,而不是拆成多个专用工具。文章指出,这种设计更接近真实听众的行为,也是在缩小当前音频模型与人类实时交流方式之间的差距。为了训练模型,团队没有直接依赖现成数据集,因为现有音频数据大多是短片段,缺少长序列和稀疏回应信号。

于是他们构建了三阶段的合成数据流程:先由语言模型生成一个合理场景,再从数据库中检索匹配音频或用音频模型补齐缺失声音,最后通过预处理让剪切边界听起来更自然。最终得到的StreamAudio-2M数据集包含260万个单元和约302,000小时音频,覆盖7个技能领域和28个子任务。在评测中,Audio-Interaction在MMAU音频基准上取得58.15分,略高于其基础模型Qwen2.5-Omni-3B,并且接近更大的7B模型;在英中翻译任务上也有明显提升。论文还称,它在新的ProactiveSound Bench上击败了Gemini 3 Flash等系统。为了适配实时使用,研究人员将音频处理和回复生成拆分为并行流程,并通过队列交换数据,这让首字响应时间从831毫秒降到392毫秒,同时把卡住的情况降到了5.2%。

该模型在每个0.4秒的音频片段后,会输出<silent>或<response>来决定是否继续沉默,而不是等整段录音结束。论文称它使用了StreamAudio-2M进行训练,这是一个合成数据集,包含260万个单元、约302,000小时音频,覆盖7个技能领域和28个子任务。

查看单篇正文查看原文
12

The Verge AI

Meta 的 AI 应用开始推送点击诱饵式故事

·#meta-ai

Meta 的 AI 应用开始推送点击诱饵式故事

Meta 的独立 Meta AI 应用现在加入了一个“为你推荐”信息流,会用 AI 生成带有点击诱饵风格的故事,连标题、图片和正文都由 AI 生成。这个变化也意味着,应用早先偏社交化的 Discover 信息流已经被更常规的聊天机器人界面和推荐式故事卡片所取代。

这次更新表明,Meta 正在尝试一种原生 AI 内容信息流,目标是不断吸引用户点击,即使生成结果质量不高甚至语义混乱。它也引发了更大的问题:生成式 AI 到底是在改善内容发现,还是在把社交平台里的信息流垃圾内容自动化。

Meta 正在把自己也变成点击诱饵内容的生产者。Meta AI 独立应用里新增了一个“为你推荐”版块,会显示一组建议性的故事提示,用户点进去后,系统会生成完整故事,而这些故事的标题、图片和正文几乎都由 AI 生成。The Verge 表示,这些内容通常显得空洞、重复,而且质量相当可疑。该应用最初在 2025 年 4 月上线时,重点是一个公开的 Discover 信息流,展示其他用户生成的 AI 图片和对话,但那个界面现在已经消失,取而代之的是标准聊天机器人界面和新的推荐流。测试中,The Verge 发现这个推荐流会以非常奇怪的方式进行个性化:一位在伦敦的记者收到很多英国相关话题,比如茶、礼仪、酒吧、王室和足球;另一位同事则被分到大量奢侈手表话题。

很多故事标题都很像典型的点击诱饵,例如关于“皇家管家”“排队心理”“英国人冷嘲热讽的艺术”以及“Rolex 等待名单”的内容。部分故事似乎能追溯到现实中的素材,但更多内容看起来像是编造出来的,或者只是借用了模糊的“专家”“研究”之类说法。报道还指出,应用的聊天记录里能看到隐藏的提示词和内部指令,说明这些故事并不是随意生成,而是由后台提示模板驱动。反复点击同一个卡片时,生成结果大致保持同一主题,但会出现细微变化;如果把同样标题单独输入聊天框,系统又可能给出完全不同的回答。

The Verge 发现,这个信息流具有明显的个性化特征,例如一位记者看到的是英国文化相关话题,另一位则看到与奢侈手表有关的内容。部分条目看起来像是轻微包装过的编造内容,或者只有模糊来源的概括,而且重复点击通常只会生成同一提示的略微不同版本,而不是稳定一致的文章。

查看单篇正文查看原文
13

The Verge AI

苹果准备再次重启 Siri

·#apple

苹果准备再次重启 Siri

《The Verge》称,苹果准备在 WWDC 上再次推出新的、由 Gemini 增强的 Siri,此前苹果围绕 Apple Intelligence 和 Siri 的首次发布并没有兑现承诺的功能。报道还说,更新后的助手可能会出现在灵动岛、照片等位置,甚至可能首次拥有独立的 Siri 应用。

这很重要,因为在实际助手能力上,Siri 已经落后于 Gemini 等竞争对手,但苹果也可能因为并非直接承担最具争议的 AI 基础设施和隐私权衡而获得战略优势。此次更新可能会影响消费者对 AI 助手的看法,因为它们正在变得更主动,也更深地嵌入日常应用中。

《The Verge》认为,苹果过去几年在 AI 方面一直处于被动,但落后反而可能让它以一种意想不到的方式受益。到了 WWDC,苹果似乎又要重新介绍一次“新 Siri”,而这次的概念其实早在 2024 年随 Apple Intelligence 一起出现过。那次发布给 Siri 带来了发光边框、不同的语音选项,以及把部分问题转交给 ChatGPT 的能力,同时苹果还承诺后续会有更多“智能”功能。结果这些承诺并没有真正落地,苹果围绕 Apple Intelligence 的宣传也被认为过于误导,因此公司现在正在解决一起集体诉讼,并需要向 iPhone 用户赔付。

文章称,苹果这次可能会推出某种基于 Gemini 的 Siri,尽管从能力上看,Gemini 目前已经领先,能够做叫 Uber、点 DoorDash 外卖、结合日历判断何时该出发去机场等事情。与此同时,文章指出,AI 助手越强大,对很多人来说也越显得诡异,尤其是在它开始更主动地理解和执行个人需求时。苹果或许能借此获得一个优势:它可以比谷歌更少地暴露在数据中心扩张和公众反感之下,因为真正的基础设施负担和争议会更多落在谷歌身上。文章还预计,苹果会把这次 Siri 更新做得更“无处不在”,比如出现在灵动岛、照片里,甚至可能第一次拥有独立的 Siri 应用,同时继续强调 Private Cloud Compute 等隐私卖点。

文章强调,苹果此前推动 Apple Intelligence 的宣传误导性很强,甚至引发了集体诉讼和向 iPhone 用户赔付。文章还指出,更激进的 Siri 可能会再次把隐私叙事放到核心位置,包括提到 Private Cloud Compute,以及可能支持在一段时间后自动删除聊天记录。

查看单篇正文查看原文
14

ZDNET AI

The 7 coolest gadgets I saw at Computex 2026 (and when you can buy each one)

·#computex

The 7 coolest gadgets I saw at Computex 2026 (and when you can buy each one)

ZDNET highlights seven standout gadgets from Computex 2026, including Nvidia's RTX Spark laptops, budget-premium PCs, and gaming accessories aimed at consumers.

A useful roundup of notable Computex 2026 consumer hardware, including new laptop chips, value-focused laptops, and gaming display accessories, but it is primarily a trade-show gadget list rather than a deep technical analysis. No comments or discussion quality were provided.

Follow ZDNET: Add us as a preferred source on Google. Computex, the world's biggest computing trade show, takes place in Taipei every year, but 2026 was especially big. For starters, Nvidia announced its new RTX Spark processor for high-end consumer laptops, rallying each of the major consumer laptop brands to show off their new models to much fanfare and impressive stats (but not a whole lot of backup).On the flip side, many of those same brands also announced new "cheap premium" laptops in the $599-$699 range as a response to the MacBook Neo -- Apple's incredible-value laptop that thoroughly disrupted the PC…

查看单篇正文查看原文