OpenAI 同时打出科研与资本两张牌
公司一边称模型推翻单位距离猜想、证明长期几何问题,一边又被报道最快 9 月推进 IPO,估值可能冲到 1 万亿美元,显示 AI 叙事正同时进入学术与公开市场。[1911][1910][1912]
AI 日报
2026 年 5 月 21 日的核心主题很清晰:AI 正在从模型竞赛,快速转向资本市场、基础设施和用户入口的全面重构。OpenAI 既被报道筹备万亿美元级 IPO,又宣布模型在数学上取得突破;Google 则把搜索、代理、购物、视频和移动开发全面推向 AI 化;与此同时,xAI、Nvidia 和数据中心投资继续把算力战争推向更高成本和更强争议。
Overview
从 70 条资讯中筛选出 36 条
2026 年 5 月 21 日的核心主题很清晰:AI 正在从模型竞赛,快速转向资本市场、基础设施和用户入口的全面重构。OpenAI 既被报道筹备万亿美元级 IPO,又宣布模型在数学上取得突破;Google 则把搜索、代理、购物、视频和移动开发全面推向 AI 化;与此同时,xAI、Nvidia 和数据中心投资继续把算力战争推向更高成本和更强争议。
公司一边称模型推翻单位距离猜想、证明长期几何问题,一边又被报道最快 9 月推进 IPO,估值可能冲到 1 万亿美元,显示 AI 叙事正同时进入学术与公开市场。[1911][1910][1912]
从 AI Mode、Gemini 3.5 Flash,到代理购物、Android 应用生成、YouTube Shorts 混剪和 XR 眼镜,Google 正在把 AI 深度嵌入核心消费级入口。[1914][1916][1917][1922][1930][1938][1941][1944]
Anthropic 购买 xAI 算力、xAI 继续加码燃气涡轮机、Utah 批准超大型数据中心、Nvidia 也以巨额交易和投资绑定生态,说明 AI 竞争已进入电力与基础设施时代。[1913][1915][1918][1929]
Visa 和 Verizon 都指出,AI 正在推动授权支付诈骗、移动钓鱼和社会工程攻击上升;Google、OpenAI 则试图用 SynthID 和内容凭证回应真实性危机。[1921][1943][1946][1932]
Google、Figma、DeepSeek 和 Ramp 的更新都在说明,真正的竞争点不只是模型,而是代理如何连接工具、记忆、设计、代码和交易执行。[1922][1926][1927][1935][1944]
AI 搜索初创公司融资火热、NanoCo 获得追捧、Harvey 讨论收费模式变化,同时 FT 也提醒大型 AI IPO 可能把风险转移给散户。[1924][1937][1934][1933]
AI 正在从“模型更强”进入“系统重写”阶段:一端是 OpenAI、Google 继续把前沿能力塞进搜索、创作、编程和科研;另一端是资本、算力和合规问题迅速放大,决定谁能把这些能力规模化落地。[1912][1914][1916][1913][1918]
OpenAI 一边宣称模型推翻了 80 年历史的单位距离猜想,另一边又被报道最早可能在 9 月提交 IPO 文件,估值或达 1 万亿美元。这让公司同时站在“AI 参与前沿科研”和“AI 进入公开市场审视”的两个中心位置。[1911][1910][1912]
Google 在 I/O 2026 上集中释放信号:搜索正向对话式、代理式体验迁移,Gemini 3.5 Flash 已进入正式可用,AI 购物、Android 应用生成、YouTube Shorts 混剪和 XR 眼镜也都在同一条产品线里展开。它不只是发布模型,而是在重写用户与 Google 产品交互的默认方式。[1914][1916][1917][1922][1930][1938][1941][1944]
Anthropic 与 xAI 的巨额算力协议、xAI 继续采购燃气涡轮机、Utah 批准超大数据中心,以及 Nvidia 的大规模投资行动,都在说明:AI 竞争的瓶颈已经不只是模型,而是电力、机房、资本和监管许可。[1913][1915][1918][1929]
Google 把 SynthID 验证带进 Chrome 和 Search,OpenAI 也在推进内容标记;与此同时,Visa 和 Verizon 的报告都指向更现实的威胁:AI 正在加速诈骗、移动钓鱼和授权支付欺诈。生成式能力越强,围绕真实性和身份验证的防线就越重要。[1921][1943][1946][1932]
OpenAI 的两则数学故事是今天最具象征性的信号:一则是模型解决单位距离问题,另一则是公司再次宣称证明了长期几何猜想。无论最终如何被学界验证,它们都在强化一个趋势——通用推理模型正在被用来接近传统科研工作流的核心环节。[1911][1910]
Google 的 Gemini Spark、Universal Cart、AI Studio 生成 Android 应用,以及 Figma、DeepSeek、Ramp 等产品案例,都说明代理不再只是聊天框里的概念,而是在设计、购物、编程和工作流里逐步接管具体步骤。[1922][1944][1938][1926][1927][1935]
OpenAI 的 IPO 传闻、AI 搜索初创公司融资升温、Harvey 讨论律师收费模式变化、NanoCo 拒绝收购并完成种子轮,都表明 AI 不只是在改变产品,也在改变公司估值逻辑、收入结构和竞争格局。[1912][1924][1933][1934][1937]
今天最重要的不是某一个单点发布,而是 AI 行业的重心已经同时落在三件事上:能否真正产生原创成果、能否在巨额基础设施上持续扩张、以及能否在安全和信任层面守住边界。接下来几个月,IPO、算力合同、代理产品和内容验证系统,很可能会比单纯的模型参数更能决定行业走向。[1912][1913][1921][1943]
Stories
OpenAI News
OpenAI 表示,其一个模型解决了已有 80 年历史的单位距离问题,从而推翻了离散几何中的一个核心猜想。公司将此视为 AI 驱动数学发现的一个里程碑。
单位距离问题是离散几何中最著名的公开难题之一,因此即使不考虑 AI,解决它本身也是重要数学成果。如果一个 AI 模型能够帮助推翻长期存在的猜想,这将进一步说明模型不仅能处理常规任务,还可能参与前沿科研。
OpenAI 报告称,其一个模型解决了离散几何中已有 80 年历史的单位距离问题。这个结果并不是简单地给出一个更好的上界,而是被描述为推翻了该领域的一个重要猜想。单位距离问题最早由 Erdős 在 1946 年提出,问题是:平面上的 n 个点中,有多少对点之间的距离可以恰好等于 1。它被公认为离散几何中最著名、最重要的未解问题之一。
OpenAI 链接的证明材料显示,该模型建立了一个与单位距离猜想相矛盾的定理。也就是说,这一发现不仅在数学上很重要,也表明 AI 系统可能开始参与非平凡的定理发现。OpenAI 将这一成就称为 AI 驱动数学的一个里程碑。
这个问题最早由 Erdős 在 1946 年提出,研究的是平面上 n 个点中,最多能有多少对点之间的距离恰好为 1。OpenAI 链接的证明说明中写道,该模型推翻了单位距离猜想,这表明结果涉及平面点集中的单位距离最大数量问题。
Financial Times AI
据报道,OpenAI 正在准备首次公开募股(IPO)文件,最快可能在九月提交,参与方包括高盛、摩根士丹利以及 Cooley 律师事务所。相关报道还提到,这次上市估值可能达到 1 万亿美元。
如果消息属实,这将是科技史上规模最大、影响最深远的上市之一,意味着 AI 基础设施和模型开发商正进入一个新的公开市场审视与融资阶段。它也会影响 AI 生态中的竞争对手、投资者和合作伙伴,并为整个行业设定估值标杆。
据《华尔街日报》消息,OpenAI 正在推进首次公开募股(IPO)准备工作,公司希望最早在九月具备上市条件。报道称,OpenAI 已与高盛、摩根士丹利这两家重要的科技 IPO 承销商合作,并聘请了 Cooley 律师事务所。根据题述内容,OpenAI 可能会在数天或数周内向监管机构提交保密 IPO 文件。外界普遍认为,这将是一笔“重磅”上市交易,估值可能达到约 1 万亿美元。
消息发布的时间点,正好是在埃隆·马斯克刚刚输掉一场可能威胁 OpenAI 结构、管理层和财务状况的诉讼之后。报道将这场长期围绕 OpenAI 创始人与前合作伙伴之间的争夺,描述为从法庭转向资本市场。与此同时,SpaceX 的 IPO 文件也被预计将很快公开,这让这一时期的科技金融话题更加集中。OpenAI 对置评请求没有立即作出回应。
报道指出,OpenAI 可能在数天或数周内向监管机构进行保密 IPO 申报,这意味着在流程后期之前,草案文件不会对外公开。OpenAI 的混合结构也很关键,因为其营利性业务和非营利基金会可能会影响上市的具体安排。
TechCrunch AI

据报道,Anthropic同意从xAI的Colossus 1数据中心购买算力,费用为每月12.5亿美元,合同持续到2029年5月。协议前两个月还会有折扣,以配合xAI完成产能爬坡,按此计算,xAI总收入可能超过400亿美元。
这是一项具有标志性的前沿AI基础设施商业化案例,表明算力本身正在成为一种规模空前的核心商品。它也说明AI实验室可以同时扮演建设者和算力出售方,这可能重塑行业竞争、资本开支和定价方式。
Anthropic在本月早些时候震惊了AI行业,同意从xAI购买300兆瓦的算力,相当于几乎包下孟菲斯附近Colossus 1数据中心的全部产出。随后,SpaceX向美国证券交易委员会提交的S-1文件披露了这笔交易的更多财务细节。文件显示,Anthropic将从现在起到2029年5月,每月向xAI支付12.5亿美元,前两个月还会享受折扣,以便xAI完成产能爬坡。按这一安排计算,这笔合同可能为xAI带来超过400亿美元的收入。文件还说明,合同双方任何一方都可以提前90天终止协议。xAI表示,这笔交易有助于把其基础设施中未被使用的算力变现,SpaceX则称这是其“雙重变现”策略的一部分,能够为已投入资本带来回报。
报道指出,这让xAI在AI市场中形成了一种混合角色:既为自己的模型建设数据中心,也把多余算力卖给外部客户。文章还强调,这种做法并不常见,因为大多数AI公司要么只为内部使用建设数据中心,要么只作为基础设施服务商面向外部客户,而不会同时兼任两者。业内有时把这种模式称为“neocloud”,即AI公司在自有模型需求低于算力容量时,通过对外提供云服务来分摊基础设施成本。报道暗示,xAI可能建得过度超前,因此需要在可能的公开上市之前尽快实现资产变现。文章最后提到,Grok最近几个月的使用量明显下降,这使xAI手中出现了可供出售的服务器资源,而买家恰好是它最接近的竞争对手之一。
这批算力来自孟菲斯附近的Colossus 1,xAI将其建成超级计算机,主要用于训练Grok,相关资料称其算力容量超过300兆瓦。文件还提到双方任何一方都可提前90天终止合同,xAI表示未来预计还会签署更多类似服务合同。
Ars Technica AI

Google正在加速把传统搜索转向“AI优先”的对话式体验,据称AI Mode每月用户已超过10亿,而且每个季度都在翻倍增长。公司还推出了更紧密整合AI Overviews与AI Mode的新搜索体验,以及会引导用户进入AI生成交互的新搜索框。
这件事很重要,因为Google搜索是全球使用最广泛的消费级产品之一,它的核心交互方式变化会重塑数十亿人获取信息的方式。如果AI Mode继续扩张,传统的“10条蓝色链接”结果可能不再居于中心地位,这会影响用户、内容发布者以及整个SEO生态。
这篇文章认为,Google向AI搜索的转变已经不再是实验,而是公司级的战略方向。到I/O 2025时,Google已经把AI Mode正式推到台前,而在I/O 2026上,搜索副总裁Liz Reid更直言“Google search is AI search”。Reid表示,AI Mode的使用量每个季度都在翻倍,目前每月用户已超过10亿。文章指出,这一增长得益于Google对AI Mode的大力推广,包括显眼的入口提示和链接,而且这一功能对所有Google搜索用户开放,不需要订阅付费。文章还提到,AI Overviews虽然仍然醒目,但越来越像是通向AI Mode的过渡层,而不是最终形态。
Google正在扩展一种“无缝”体验,把AI Overviews和AI Mode连起来,并且这个入口已经从移动端延伸到桌面端。现在,AI Mode的提示会显示在Overview底部,甚至会遮住一部分传统搜索结果,这也可能进一步把用户引向AI Mode,而不是继续浏览“10条蓝色链接”。文章还介绍了一个新的搜索框:它会随着输入动态展开,并利用基于Gemini的生成式AI更积极地猜测用户意图。除了对话式搜索之外,Google还在用Gemini 3.5 Flash推动更接近“代理式”的搜索体验,包括为一些概念生成交互式界面,以及在某些查询下自动创建定制应用来帮助完成任务。整体来看,这篇报道把Google搜索的未来描述为一个更偏向AI驱动、交互式、以结果解决问题为中心的系统,而不是单纯返回网页链接的搜索引擎。
Google表示,AI Mode的使用量每个季度都在翻倍,而且所有使用Google搜索的人都无需付费即可使用这一功能。公司还在用Gemini 3.5 Flash和Antigravity测试代理式搜索体验,包括生成式界面,以及针对某些查询自动创建定制应用。
Financial Times AI
《金融时报》报道称,英伟达正以约900亿美元的交易和投资行动支持AI热潮,并加深与客户和初创公司的绑定。报道指出,这种投入规模可与大型科技公司的顶级风投业务相媲美。
这表明英伟达不仅在出售AI时代的“铲子和铁锹”,还在影响谁能以何种条件进入其生态系统。此举可能进一步巩固英伟达在AI基础设施中的平台权力,同时让初创公司和客户更加依赖其技术。
《金融时报》报道称,英伟达正通过一轮约900亿美元的交易和投资行动来推动AI热潮。报道认为,这家芯片制造商的投入规模已经可与大型科技公司最庞大的风投业务相提并论。英伟达并不只是依靠卖芯片获利,还在把客户和初创公司更紧密地绑定到自己的技术体系中。这样的做法会让其硬件和软件在AI公司的成长过程中变得更加核心。
它也让英伟达在AI基础设施链条中拥有更强的话语权,能够影响哪些企业更快扩张。更广泛地看,英伟达正在从单纯供应商转变为生态架构者。由于算力和专用芯片在AI市场中极其关键,这种资金支持可能进一步加深企业对英伟达平台的长期依赖。
这一策略更像企业风投和生态建设,而不只是单纯的产品销售。检索结果提到,英伟达拥有NVentures风投部门和Venture Capital Alliance,旨在投资技术公司,并把投资者与英伟达的专业能力和资源连接起来。
Google AI Blog

Google 在 I/O 2026 上汇总了 100 项发布,涵盖模型、智能体以及用于构建、搜索、创作、购物和提升效率的工具。最核心的发布是 Gemini 3.5 Flash,它已可通过 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio 正式使用。
这次更新表明 Google 正在把最新的 Gemini 模型更深入地嵌入消费级产品和开发者工作流,尤其是面向智能体和多模态场景。对于开发者、创作者和企业来说,这意味着更快的模型可用性、更低成本的自动化,以及在 Google AI 生态中的更紧密集成。
Google 在 I/O 2026 的总览中,把这次活动定位为一场涵盖 100 项发布的大型展示,涉及模型、智能体以及各类产品体验。最重要的开发者消息是 Gemini 3.5 Flash,Google 将其描述为最新系列中的首个模型,结合了前沿智能和行动能力。Google 表示,该模型已可通过 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio 正式使用。公司还称它进入了 Artificial Analysis 指数的右上象限,意味着在保持较高速度的同时仍具备很强的模型质量。Google 将它定位为适合长周期智能体任务的模型,例如应用开发、代码库维护,甚至财务文件准备。Google 还表示,Gemini 3.5 Flash 建立在 Gemini 3 的多模态基础之上,能够生成更丰富的交互式网页界面和图形。
与此同时,Google 提到 Gemini 3.5 Pro 已在内部使用,并计划在下个月推出。除了文本和代码,Google 还推出了 Gemini Omni,这是一款从任意输入生成任意内容的新模型,当前先从视频生成开始。Omni 把 Gemini 的智能与 Google 的生成式媒体模型结合起来,并加入了更好的物理规律理解,使画面更真实,同时还嵌入了不可感知的 SynthID 水印用于内容验证。Google 表示,Omni 可以引用图像、文本、视频或音频作为输入,且音频目前先支持语音引用。该模型将向 Google AI Plus、Pro 和 Ultra 订阅用户在 Gemini 应用和 Google Flow 中开放,同时也会免费提供给 18 岁及以上用户在 YouTube Shorts Remix 和 YouTube Create 中使用。Google 还强调,Omni 让视频创作和编辑变得更像对话式操作,例如可以通过简单提示实现电影感缩放或背景替换,而且在不同场景之间还能更好地保持角色一致性。
Google 表示,Gemini 3.5 Flash 主打在更低延迟和更低成本下提供前沿级智能,适合规划、构建、迭代和维护代码库等长周期智能体任务。此次汇总还提到 Gemini Omni 先从视频生成开始,支持图像、文本、视频和音频等参考输入,并加入 SynthID 水印,同时会在 Gemini、Flow 和 YouTube Shorts Remix 中推出。
Simon Willison

Google 在 Google I/O 上发布了 Gemini 3.5 Flash,并且没有经过任何 -preview 阶段,直接进入正式可用。它现在已被部署到 Gemini 应用、Google Search 的 AI Mode、开发者工具以及企业产品中。
这次发布之所以重要,是因为 Google 把一个重新定价的新模型直接放进了面向数十亿用户的产品中,而不只是开放 API。它说明 Google 把 Gemini 3.5 Flash 视为面向消费者和开发者工作流的核心模型,同时也在试探客户对更强能力的价格接受度。
在 Google I/O 上,Google 发布了 Gemini 3.5 Flash,并且没有把它标记为预览版,而是直接进入正式可用。Google 表示,这个模型已经通过 Gemini 应用和 Google Search 的 AI Mode 向全球数十亿用户开放,也会提供给开发者在 Google Antigravity、Google AI Studio 的 Gemini API 以及 Android Studio 中使用。企业用户则可以通过 Gemini Enterprise Agent Platform 和 Gemini Enterprise 获得访问权限。开发者文档显示,该模型的 ID 是 gemini-3.5-flash,知识截止时间为 2025 年 1 月,支持 1,048,576 个输入 token 和 65,536 个最大输出 token。
它大体延续了 Gemini 3.x 系列的功能,但不包含 computer use。Google 还在推广一个处于 beta 阶段的 Interactions API,看起来类似 OpenAI Responses 的模式,尤其强调服务端历史管理。最引人注意的是价格上涨:Gemini 3.5 Flash 的价格大约是 Gemini 3 Flash Preview 的 3 倍,也是 Gemini 3.1 Flash-Lite 的 6 倍。按每百万输入 token 1.50 美元、每百万输出 token 9 美元计算,它的价格已经接近 Gemini 3.1 Pro,而 Google 还表示 Gemini 3.5 Pro 将在下个月推出。
该模型的 ID 是 gemini-3.5-flash,知识截止时间为 2025 年 1 月,支持 1,048,576 个输入 token 和 65,536 个最大输出 token。与之前的 Flash 模型相比,它价格明显更高,并且不支持 computer use;同时 Google 还在推广处于 beta 阶段的 Interactions API,提供服务端历史管理。
TechCrunch AI

·#xai
SpaceX 的 IPO 文件显示,xAI 计划在未来三年内再投入 28 亿美元用于 AI 基础设施涡轮机采购,其中约 20 亿美元专门用于“移动燃气涡轮机”。这与其当前因污染问题而被起诉的设备类型一致。
这一举动表明,xAI 即使面临监管和环保团体对污染的质疑,仍在继续押注可快速部署的电力方案来支撑数据中心。此案可能影响 AI 公司在快速扩张基础设施时,如何在空气质量法规、许可审批和地方反对之间取得平衡。
埃隆·马斯克的 xAI 目前正因其位于田纳西州孟菲斯附近的数据中心供电系统而承受越来越大的压力。NAACP 已就该公司使用污染性燃气涡轮机提起诉讼,称这些设备加剧了本已严重污染地区的空气质量问题。尽管存在这场争议,SpaceX 于周三发布的一份 IPO 文件显示,xAI 未来三年还将额外购买价值 28 亿美元的涡轮机用于 AI 基础设施。 其中大约 20 亿美元专门用于“移动燃气涡轮机”,而这正是诉讼争议的核心设备类别。xAI 目前只获得了 15 台涡轮机的许可,但几周前却已经在使用 46 台。
报道指出,每一种这类涡轮机每年都可能排放超过 2000 吨 NOx 污染物,这类化学物质会促成诱发哮喘的烟雾污染。xAI 的说法是,这些设备之所以可以在没有许可的情况下运行长达一年,是因为它们仍然停放在运输时所用的拖车上。公司似乎是在利用州和联邦对“移动式”设备认定上的差异:密西西比州认为移动发电机不需要许可,而联邦法规则认为,即使装在拖车上,这种规模的涡轮机仍受空气污染法规约束。EPA 今年早些时候已经裁定,xAI 的做法违反了联邦法律。SpaceX 的文件还明确承认了风险,称其 AI 业务“严重依赖”天然气和燃气涡轮技术来为数据中心供电,而禁令或许可证被撤销都将对业务造成不利影响。
NAACP 上月起诉 xAI,指控其在孟菲斯附近运行数十台未经监管的燃气涡轮机,加剧了美国污染最严重地区之一的空气质量问题。xAI 则称这些设备属于“移动式”,因为它们仍安装在运输拖车上,但 EPA 今年早些时候已裁定这些涡轮机的运行违反联邦法律。
TechCrunch AI

OpenAI表示,其新的通用推理模型给出了一份原创证明,推翻了保罗·埃尔德什在1946年提出的一个著名几何猜想。公司称,这是AI首次自主解决数学领域中的一个重要公开问题,并公布了包括Noga Alon、Melanie Wood和Thomas Bloom在内的数学家支持性意见。
如果得到验证,这将成为AI辅助数学的一个重要里程碑,说明模型可能已经能够维持长链条推理,并产生真正的新结果,而不只是复述已知答案。OpenAI认为,这种能力不仅影响数学,还可能对生物学、物理学、工程和医学产生意义。
OpenAI表示,其最新的推理模型给出了一份原创证明,推翻了保罗·埃尔德什在1946年提出的一个长期未解的几何猜想。按照公司的说法,数学界长期认为这个问题的最佳解大致会像方格排列,但模型发现了一类不同的构造,而且表现更好。OpenAI称,这是其AI系统首次自主解决一个数学领域中的重要公开问题。为了支持这一说法,公司同时发布了数学家Noga Alon、Melanie Wood和Thomas Bloom的配套评论。
Thomas Bloom维护着 Erdos Problems 网站,他此前曾把OpenAI另一项类似宣布称为“严重误导”。这次公告发生在前一次风波之后:当时OpenAI前副总裁Kevin Weil声称GPT-5解决了10个未解的埃尔德什问题,但后来发现这些“解法”早已存在于文献中。OpenAI表示,这一次没有重蹈覆辙,并认为自己展示的是一份原创证明。公司还将这一结果解读为AI正在更擅长维持漫长而困难的推理链条,并在不同学科之间建立联系。
公司表示,这份证明来自一个新的通用推理模型,而不是专门为数学或为这个猜想定制的系统。相比之下,这次说法比OpenAI此前关于GPT-5解决埃尔德什问题的表述更可信,因为那次后来被证明只是找到了文献中早已存在的解法。
The Decoder

Google DeepMind 发布了 Gemini 3.5 Flash,它的输出速度超过每秒 280 个 token,被称为同类智能水平中最快的模型。不过,它的运行成本约为前代的 5.5 倍,token 价格也从 Gemini 3 Flash 时代上涨了三倍。
这次发布体现了一个更广泛的行业趋势:更前沿的新模型正在变得更快、更强,但运行成本也明显上升。这对开发者和企业很重要,因为模型选择越来越取决于端到端任务效率,而不只是单纯看每个 token 的价格。
Google DeepMind 推出了 Gemini 3.5 Flash,作为其模型线中的新一代升级版本,重点强调速度提升和能力增强。根据报道,这个模型每秒可输出超过 280 个 token,因此被认为是同类智能水平中最快的模型。与此同时,它的运行成本也明显上升,约为 Gemini 3 Flash 的 5.5 倍。Google 还将 token 定价提高到每百万输入 token 1.50 美元、每百万输出 token 9.00 美元,而 Gemini 3 Flash 之前的价格分别是 0.50 美元和 3.00 美元。按单个 token 计算,Gemini 3.5 Flash 仍然比 Gemini 3.1 Pro 便宜,但在实际使用中,这种优势会被抹平,因为 agent 任务会消耗更多 token。
Artificial Analysis 的测试显示,尽管单价更低,但在 agent 基准上,Gemini 3.5 Flash 的总成本仍比 Gemini 3.1 Pro 高出 75%。它最明显的进步出现在 agentic 和多模态任务上,在 GDPval-AA 测试中接近 GPT-5.4 的水平,明显超过了之前的 Gemini Flash 版本。不过,它在编程方面仍然是短板,这限制了它在许多重要 agent 场景中的实际价值。报道认为,这一变化反映了 AI 正在走向更复杂的多步骤系统,模型需要自主规划、使用工具并经历更多交互轮次,因此买家越来越难准确判断投资回报。
虽然 Gemini 3.5 Flash 的单 token 价格仍低于 Gemini 3.1 Pro,但在 agent 任务中消耗的 token 更多,导致在 Artificial Analysis 的测试里总成本反而比 Pro 高出 75%。它在 agentic 和多模态任务上的提升最明显,但编程能力仍明显落后于 GPT-5.5 和 Claude Opus 4.7。
The Verge AI

谷歌在 I/O 大会上宣布,SynthID 验证功能将加入 Chrome 和 Search,用户可以直接在主流浏览器和搜索产品中检查图片是否带有谷歌的隐形 AI 水印。谷歌还会在同一验证界面中支持 C2PA Content Credentials;与此同时,OpenAI 表示将把 SynthID 嵌入 ChatGPT、Codex 和 OpenAI API 生成的图片中。
这对 AI 溯源工具来说是一次重要扩张,因为把验证能力放到浏览器和搜索引擎层面,能让远比单独上传式工具更多的人接触到真实性检查。若被广泛采用,这些系统可能更容易识别未标注的 AI 生成内容,并减少误导性深度伪造在网上的传播。
这篇文章认为,AI 标记和验证系统正在迎来最关键的现实测试。SynthID 和 C2PA Content Credentials 都在更大范围内部署,这给了它们一个机会,去证明自己是否真的能遏制网上那些没有标注来源、却足以误导用户的 AI 生成图片、视频和音频。谷歌在 I/O 大会上宣布,Chrome 和 Search 将支持验证图片是否包含 SynthID 标记,而 SynthID 是谷歌 AI 模型生成内容上的隐形水印。这个变化很重要,因为 Chrome 拥有极大的浏览器市场份额,Google Search 也是人们发现可疑图片的主要入口,所以这种验证能力会比目前在 Gemini 应用里手动上传检查的方式覆盖更多用户。
谷歌的新验证界面还会同时检查 C2PA 信息,让用户可以在一个地方同时查看 SynthID 和 C2PA,而不必在不同工具之间来回切换。C2PA 由 Content Authenticity Initiative 推动,它是在内容创建时附加的溯源元数据,用来说明内容如何生成、如何被修改,以及是否使用了 AI 工具。OpenAI 也参与了这次扩展,表示会在 ChatGPT、Codex 和 API 生成的图片中嵌入 SynthID,同时继续保留 C2PA 元数据。文章对 C2PA 的实际效果持怀疑态度,因为元数据很容易被社交平台去除,甚至截图也可能把它清掉;相比之下,SynthID 看起来更难被篡改,但覆盖范围也更有限。
SynthID 的设计是把隐形水印直接嵌入 AI 生成内容,因此通常比基于元数据的标记更难被去除。C2PA 的工作方式不同,它会在内容创建时附加溯源元数据,但文章指出这种元数据往往会被平台移除,甚至截图也可能将其抹掉,因此把两种方式合并检查更实用。
The Verge AI

《The Verge》称,谷歌在 I/O 2026 上推出了新一轮 AI 代理攻势,包括面向消费者的 Gemini Spark、Daily Brief 功能,以及更广泛的谷歌内部和外部服务集成。谷歌表示,部分功能本周开始推出,另一些则会在未来几个月陆续上线。
如果谷歌能把 AI 代理做得真正实用,它可能会定义普通用户在邮箱、日历、搜索和第三方应用中与助手交互的方式。由于谷歌本来就处在很多人数字生活的中心,它的成败很可能会强烈影响整个 AI 助手市场。
文章认为,AI 代理长期以来一直被描绘成“个人助手”,但过去很多年里,它们更像不可靠的实习生,而不是真正有用的工具。过去六个月里,这一局面开始变化,主要原因是开源 AI 代理平台 OpenClaw 的迅速走红,它证明了代理式工作流在实践中确实可能有用。OpenClaw 的成功让各大 AI 实验室迅速提高了对代理产品的重视程度,而 OpenAI 也在 2 月收购了 OpenClaw,并聘请其创建者 Peter Steinberger。The Verge 认为,谷歌现在尤其有机会把这股趋势转化为面向大众的产品。谷歌在 I/O 2026 上宣布了用于信息收集、活动规划、邮箱和日历摘要等任务的代理,同时还扩展了开发者工具,并为 Search 增加了更多生成式 AI 功能。
谷歌的新消费者代理 Gemini Spark 旨在覆盖谷歌自身服务以及 30 多个外部合作伙伴,而且它可以在云端 24 小时运行,不需要用户一直开着笔记本电脑。文章强调,谷歌最大的优势在于其现成的生态系统:它可以深度连接 Gmail、Drive、Docs、Photos、Search 等产品,而这些产品本身就已经掌握了大量用户的数字生活信息。Google DeepMind CTO Koray Kavukcuoglu 对 The Verge 表示,过去 AI 代理更多还是研究概念,但今年他希望它们能真正进入日常生活。文章最后指出,如果谷歌的方案真的如其所说那样有效,那么这可能会成为 AI 代理在大规模场景下变得真正有用的重要一步。
Gemini Spark 设计为在云端持续运行,可在网页、Android 和 iOS 之间同步,并与谷歌服务及 30 多个外部合作伙伴协同工作,例如 Dropbox、Uber 和 Spotify。文章还指出,谷歌正借助类似 MCP 的集成方式和自身产品生态,这可能比 OpenClaw 依赖应用的方式更具优势。
Financial Times AI
据报道,英伟达的游戏芯片在首席执行官黄仁勋访问期间被中国禁止销售,这进一步加大了这家美国芯片公司在其重要海外市场面临的压力。此举也表明,北京正试图将需求引向华为、寒武纪等本土企业。
中国是英伟达最大的市场之一,因此即使是有针对性的限制,也可能影响收入、产品策略以及其在消费级和 AI 硬件领域的竞争力。更广泛地看,这表明中国半导体政策正越来越强调产业自立和降低对美国技术的依赖。
据报道,英伟达的游戏芯片是在首席执行官黄仁勋访问中国期间被限制销售的。这个时间点尤其引人注意,因为它发生在这位美国半导体行业最知名高管之一访华之际。此举显然符合北京更大的产业政策方向,即优先扶持本土企业,而不是继续依赖美国供应商。文章指出,中国希望支持华为、寒武纪等公司,帮助它们继续追赶外国竞争对手。
对英伟达来说,这一限制之所以重要,是因为中国长期以来一直是其游戏和 AI 相关硬件的重要需求来源。与此同时,英伟达对华业务还处在美国出口管制不断升级的背景下,尤其是针对其最先进芯片的限制。也就是说,英伟达一方面承受美国政府的限制,另一方面又面临中国方面的反向压力。整体来看,这表明中美之间的半导体贸易正变得更加政治化,也更加碎片化。
报道将这一限制与北京对本土芯片企业的扶持联系起来,重点是帮助它们追赶美国竞争对手,而不是全面封禁整个市场。网络结果还显示,英伟达此前已多次受到美国出口管制影响其对华销售的先进芯片,这使其中国业务同时暴露在中美两边的政策变化之下。
TechCrunch AI

TechCrunch 报道称,Exa Labs 和 Parallel Web Systems 等 AI 搜索初创公司正在筹集大额融资,AI 驱动的发现市场持续升温。彭博社称,Exa Labs 以 22 亿美元估值融资 2.5 亿美元,而 Parallel Web Systems 近期也以 20 亿美元估值融资 1 亿美元。
这一热潮表明,AI 搜索正在成为消费级 AI 的重要战场,初创公司、传统平台和基础设施提供商都在争夺信息发现入口。如果这些公司获得用户和客户,它们可能重塑搜索方式,减少对传统关键词搜索的依赖,并成为大型平台潜在的收购目标。
TechCrunch 认为,搜索领域最新的变化不仅是 Google 正在转向 AI 驱动体验,还包括一批初创公司正在争夺下一代信息发现入口。彭博社报道称,得到 Andreessen Horowitz 支持的 Exa Labs 已以 22 亿美元估值融资 2.5 亿美元,目标是切入 AI 搜索市场。报道同时把 Exa 放在更大的创业浪潮中,其中还包括 Tavily、TinyFish 和 Parallel Web Systems 等公司。Parallel Web Systems 由前 Twitter 首席执行官 Parag Agrawal 领导,据《华尔街日报》称,该公司最近在 Sequoia Capital 领投下,以 20 亿美元估值融资 1 亿美元。
文章指出,Amazon、LinkedIn 和 Reddit 等传统科技平台也在借助 AI 改造搜索与可发现性功能。这样一来,如果这些初创公司做出足够有价值的产品,它们不仅会有客户市场,也会有潜在收购方。TechCrunch 还强调,ChatGPT 仍然是最大的竞争者,因为它已经掌握了 AI 搜索的大部分界面层。不过,OpenAI 无法把搜索作为最高优先级,而 Google 又必须兼顾广告业务,这可能给 Exa 或 Parallel 这样的更小团队留下切入空间。
Exa 将自己定位为一家应用 AI 实验室,提供不依赖广告、强调质量、低延迟和可定制性的搜索引擎与 API。Parallel 则更像是面向网页 AI 的基础设施,提供 API 和代理,把实时网页上下文提供给 AI,而不是面向消费者的搜索引擎。
TechCrunch AI

Stability AI 发布了 Stability Audio 3.0,这是一组新的音频模型,能够生成超过六分钟的专业级音乐。该系列包含四个模型:small SFX、small、medium 和 large,其中较小的模型以及 medium 版本以开放权重形式提供。
这代表了 AI 音乐生成能力的明显提升,因为它把可用的歌曲长度扩展到了六分钟以上,同时还能保持音乐结构和旋律音色。它也很重要,因为 Stability AI 正在把技术进展与授权和商业化策略结合起来,这可能会影响生成式音乐工具被创作者和企业采用的方式。
Stability AI 是 Stable Diffusion 的开发公司,如今推出了一个新的音频模型系列,名为 Stability Audio 3.0。公司声称,其旗舰模型能够生成超过六分钟、达到专业级水准的音乐,这比上一代能力有了明显提升。此次发布共包含四个模型:small SFX、small、medium 和 large。两个较小的模型主要面向设备端音效和音乐生成,最长可输出两分钟音频。medium 和 large 模型则可以生成完整的 6 分 20 秒作品,并且保持音乐结构和旋律音色的连贯性。Stability AI 表示,这一长度是 2024 年发布的 Stable Audio 2.0 的两倍多。
公司把 small SFX、small 和 medium 以开放权重形式提供给用户,方便使用和修改。相比之下,large 模型只能通过 API 和付费自托管服务使用,而收入超过 100 万美元的公司还需要企业许可。Stability AI 还表示,这套新模型基于完全授权的数据训练,并且公司此前已经与 Warner Music Group 和 Universal Music Group 达成合作。与此同时,Stability AI 正在开发面向专业音乐人的新产品套件,但目前没有披露具体功能。前 Universal Audio 和 Fender 首席数字官 Ethan Kaplan 将加入公司,负责领导这条专业音乐产品线。
small SFX 和 small 两个模型各有 459M 参数,适合在设备端生成最长两分钟的音效和音乐。medium 模型有 1.4B 参数,large 模型有 2.7B 参数,两者都能生成完整的 6 分 20 秒作品;其中 large 模型只能通过 API 和付费自托管服务使用,收入超过 100 万美元的公司还需要企业许可。
TechCrunch AI

在先前与 Anthropic 和 OpenAI 合作、让 Claude Code 和 Codex 等工具可与其软件并行使用之后,Figma 现在又推出了自家的 AI 代理,并将其嵌入协作画布中。这个新代理可以通过自然语言提示生成设计、编辑现有作品,并自动化重复任务,甚至可以同时启动多个代理一起工作。
这意味着 Figma 正在更深入地进入 AI 辅助设计流程,团队不仅可以让代理起草素材,还能在同一个多人协作空间里更快地探索想法和迭代方案。与此同时,这也表明设计平台正在竞相把创作、编辑和自动化结合起来,因为 Canva 和 Adobe 等竞争对手也在推进各自的 AI 功能。
Figma 在其协作画布中加入了自家的 AI 代理,进一步延续了此前与 Anthropic 和 OpenAI 的合作策略,后者让 Claude Code 和 Codex 等工具可以与 Figma 软件并行使用。公司表示,用户现在可以用自然语言提示来生成新设计、修改现有设计,或者自动化一些重复性工作,例如生成同一设计的多个迭代版本。Figma 还表示,用户可以同时启动多个代理,让它们在多人协作画布中分别处理不同任务。公司称,这个助手所使用的模型针对设计用途做了微调,因此能更好地理解设计上下文和元素。首席设计官 Loredana Crisan 表示,随着软件开发变得更容易,真正重要的是设定方向,也就是决定做什么、它应该如何运作,以及体验应该是什么感觉。
她认为,团队现在可以在多人画布上与代理协作,一起测试想法、可视化边缘情况并打磨概念,而不必过度陷入繁琐工作。该代理会先在 Figma Design 中上线,之后再逐步扩展到其他产品。Figma 还希望未来把设计和代码在应用内进一步拉近。此次发布发生在 Figma 面临 Canva、Adobe、Flora、Krea 和 Dessn 等竞争压力的背景下;与此同时,公司去年收购了基于节点的设计工具 Weavy,并增加了新的图像编辑功能。尽管外界担心 AI 会影响设计师工作和相关软件需求,Figma 的业绩仍然增长强劲,2026 年第一季度营收达到 3.334 亿美元,同比增长 46%。
Figma 表示,这个助手背后的模型经过了针对设计用途的微调,因此代理能更好地理解设计上下文和元素。首发版本先上线 Figma Design,之后计划逐步扩展到其他 Figma 产品,并希望在应用内进一步拉近设计与代码之间的距离。
The Decoder

据报道,DeepSeek正在打造一款名为“Deepseek Code”的新代码智能体,并在北京组建专门的“Harness”团队从零开始开发。该项目旨在把模型研究与智能体能力结合起来,包括工具调用、规划和记忆。
这使DeepSeek直接进入快速增长的AI编程工具市场,而Claude Code、OpenAI Codex、Cursor和GitHub Copilot已经是重要标杆。若项目成功,开发者将多一个认真可用的智能体编程选择,同时也会加剧开发者生产力工具领域的竞争。
DeepSeek正在北京组建一个新团队,开发一款代号为“Deepseek Code”的代码智能体。报道称,这个团队被明确称为“Harness”团队,负责处理超出模型本身的部分,包括工具调用、规划和记忆。文章把这种思路概括为“模型加Harness等于智能体”,也就是说,底层模型只是系统的一部分,而智能体层才是真正把模型变成可用编程助手的关键。DeepSeek正在为该项目招聘产品经理和开发者,两类候选人都被要求是Claude Code、Cursor、OpenAI Codex和GitHub Copilot等现有工具的重度用户。
产品经理将负责路线图、反馈分析和社区建设。招聘要求还列出了agent loop、MCP、多智能体系统、上下文工程,以及对“vibe coding”的经验要求。DeepSeek将这一项目定位在研究与产品的交叉点上,并把它直接放在与Anthropic的Claude Code、OpenAI的Codex以及Cursor竞争的位置上。
招聘岗位包括产品经理和开发者,且都要求是Claude Code、Cursor、Codex或GitHub Copilot的重度用户。岗位还要求熟悉agent loop、MCP、多智能体系统、上下文工程,甚至“vibe coding”,说明团队关注的不只是模型本身,而是完整的智能体技术栈。
The Decoder

Google DeepMind 已将其 Genie 世界模型与 Street View 图像结合起来,让用户基于真实地点生成可交互的 AI 世界。该功能以 Project Genie 的实验性原型形式推出,面向 Google AI Ultra 订阅用户,并且目前先支持美国地点。
这让世界模型更接近 AI 代理、机器人和自动驾驶仿真中的实际应用,因为生成环境可以锚定在真实地点上。Google 的 Street View 数据库也带来了明显的数据优势,可能让这类训练和测试环境比竞争对手更丰富。
Google DeepMind 正在把 Genie 世界模型与 Street View 图像结合起来,创建从真实世界地点出发的可交互 AI 生成环境。用户可以在地图上选择一个位置,额外选择一种风格,并输入角色描述,然后 Genie 3 会生成一个与 Street View 画面绑定的可行走世界。Google 表示,这一能力依赖于“Maps Imagery Grounding”,这也是开发者已经用来基于 Street View 数据制作 AI 视觉内容的接口。公司展示了多个示例,例如被洪水淹没的金门大桥,以及以 1920 年代风格呈现的德州沃斯堡牲畜交易区。报道强调,Google 巨大的 Street View 数据库是它的核心优势,因为它既能作为训练材料,也能作为生成世界的锚点。
DeepMind 并不主要把 Genie 当作面向消费者的产品,而是把它视为 AI 代理和机器人用于导航、推理与学习的训练环境。DeepMind 的 SIMA 2 已经把 Genie 用作训练场,而 Waymo 也用它来模拟自动驾驶所需的真实街道场景。前 Google 产品经理 Bilawal Sidhu 发布的早期测试展示了很大的表现范围,包括驾驶 Google Maps 主题的 F1 赛车穿过拉斯维加斯大道、以松鼠骑滑板车的身份移动、驾驶小船穿越奥斯汀的 Lady Bird Lake,以及利用室内 Street View 数据步行穿过白宫。这些演示也暴露了当前的局限性,例如纹理柔和、几何结构不稳定和场景过渡超现实。Google 正在向 Google AI Ultra 订阅用户全球开放该功能,但真实地点功能目前只支持美国地点,DeepMind 也明确表示这仍是一个实验性的研究原型。
用户可以在地图上放置图钉,选择“Ocean World”“Desert Sands”“Stone Age”或“B&W film”等可选风格,并描述一个角色来生成可行走的世界。Google 表示该系统使用“Maps Imagery Grounding”,但演示仍能看到明显的粗糙之处,例如纹理发软、几何结构不稳定以及过渡效果超现实。
The Verge AI

犹他州 Box Elder 县的委员们已经批准了 Stratos Project,这是一个计划建在 Hansel Valley、占地 4 万英亩的数据中心园区。该项目由 Kevin O’Leary 支持,现已推进到下一阶段,但在开工前仍需获得环境和建筑许可。
这个项目可能成为全球最大的数据库中心之一,因此它是一个重要案例,检验 AI 基础设施如何与电力、水资源和土地使用限制发生冲突。它的规模引发了人们对环境破坏、当地资源承压,以及承诺的经济收益是否能抵消成本的担忧。
犹他州即将迎来一个规模极其夸张的 Stratos Project 数据中心园区,它计划占地 4 万英亩,横跨 Box Elder 县的 Hansel Valley。该项目已经获得县委员和州长 Spencer Cox 的批准,但在真正开工前仍需通过环境和建筑许可审批。支持者 Kevin O’Leary 将这个项目包装为强化美国 AI 领导地位和国家防务的一种方式。O’Leary 还表示,这向中国和世界其他地区传递了“美国是认真的”这一信号。尽管如此,这一批准是在专家警告和公众强烈反对的背景下发生的。
这个园区据称面积超过曼哈顿的两倍,预计将消耗 9 吉瓦电力。这个数字几乎是犹他州 2025 年峰值用电需求的两倍,而首期建设成本预计将超过 40 亿美元。开发方称园区会自带发电厂,不会直接使用州电网,而是从 Ruby Pipeline 获取天然气。批评者担心,即便如此,该项目仍会消耗海量天然气、加剧水资源压力,并带来热量、空气污染和噪音等环境影响。
该园区预计将消耗 9 吉瓦电力,几乎是犹他州 2025 年峰值用电需求的两倍,首期建设成本预计超过 40 亿美元。该地点还与美国国防部土地部分重叠,方案中包括一个现场发电厂,计划从 Ruby Pipeline 输送天然气,而不是直接依赖州电网。
ZDNET AI

ZDNET 报道称,Google 在 I/O 主题演讲中展示了 Android XR 智能眼镜计划,并透露年底前可能推出多款产品。具体包括 Warby Parker 和 Gentle Monster 的纯音频眼镜、与 Xreal 合作的 Project Aura,以及带单目显示的参考机型。
这次演示表明,Google 正试图把智能眼镜定义为由 Gemini 驱动、与手机深度联动的延伸设备,而不是独立噱头。若它能把 AI、应用整合和硬件合作真正打通,就可能在新兴消费级 XR 市场上对 Meta 和 Apple 形成压力。
ZDNET 的上手报道指出,Google 在 I/O 两小时主题演讲中,用大约 12 分钟介绍了 Android XR 以及其涵盖的“Intelligent Eyewear”类别。Google 正围绕这一平台推进多款即将推出的智能眼镜,包括 Warby Parker 和 Gentle Monster 的纯音频眼镜、与 Xreal 合作的 Project Aura,以及一款带单目显示的参考机型。文章认为,这些产品可能会在今年年底前陆续登场,但具体价格和最终功能仍未确定。作者强调,Google 真正想传达的不是新奇硬件,而是由 Gemini 驱动、并能与 Google 软件生态深度联动的使用方式。
演示中,Gemini 被要求找出美国队所有世界杯赛程,排除与巴拉圭的比赛,并自动加入 Calendar。另一段演示里,眼镜拍下一张照片,把画面中的人物改造成灰度版《神偷奶爸》小黄人,然后保存到配对手机中。作者还让 Gemini 扫描一本食谱,把所需食材整理出来,并在 Google Keep 中创建条目,同时备注下周二烹饪。整篇文章的结论是,Google 的优势可能来自几乎无缝的跨设备、跨应用整合,这种能力或许会让它在智能眼镜竞争中对 Meta 和 Apple 形成压力。
文章重点介绍了动手演示:Gemini 可以跨应用完成任务,例如把世界杯赛程添加到 Calendar,或把烹饪食材整理到 Google Keep。Google 还展示了 Project Aura,它被描述为比 Samsung Galaxy XR 头显更便携的眼镜形态设备,拥有 70 度视场角、悬浮窗口、Steam Deck 串流和 Gemini Live 支持。
Ars Technica AI

Figure AI 直播展示了其 Figure 03 类人机器人将数千个包裹分拣到传送带上的过程,整个演示持续了将近一周,并迅速在网上走红。演示中,机器人还一度与一名人类实习生同场“比赛”。
这次走红说明,精心设计的机器人演示很容易影响公众对 AI 和自动化的看法。它也凸显出:一场吸引眼球的直播,并不等于机器人已经能在复杂真实环境中稳定工作。
Figure AI 一直在直播展示其类人机器人处理包裹的过程,这场演示很快吸引了大量科技爱好者的关注,并演变成一场网络热潮。机器人在接近一周的时间里把数千个包裹放上传送带,期间公司还把这场活动包装成机器人与一名人类实习生之间的“比赛”。网络上的反应非常热烈,YouTube 评论区有人给机器人起名字,X 上的用户则用夸张的语气称赞这场直播。随着热度上升,Figure 还迅速推出了相关周边商品。演示任务本身并不复杂,但视觉效果很强:机器人需要识别小包裹上的条码,这些包裹包括纸箱以及软质缓冲信封或袋子,然后把包裹条码朝下放到传送带上。
公司表示机器人是在没有人工干预的情况下自主完成任务,但 CEO Brett Adcock 也降低了外界预期,称团队的目标只是让机器人连续工作 8 小时,并直言“很有可能会出问题”。这些机器人依赖 Figure 的 Helix 02 神经网络系统,公司称其支持全身控制和长程自主能力。Figure 还表示,其全身控制器接受了超过 1,000 小时的人体动作数据训练,并在超过 200,000 个并行模拟环境中进行了训练。文章的核心观点是:即使是非常惊艳的机器人直播,也只能展示机器人能力的一个狭窄切面,不能直接等同于其在真实世界中的全面可靠性。
这场演示于 5 月 13 日开始,原本计划进行 8 小时,机器人要识别小包裹上的条码,包括纸箱和软质缓冲信封,然后把包裹条码朝下放到传送带上。Figure 表示,机器人使用其 Helix 02 神经网络进行全身控制和长程自主任务;公司还称该控制系统基于超过 1,000 小时的人体动作数据训练,并在超过 200,000 个并行模拟环境中进行过训练。
Financial Times AI
·#ai
《金融时报》报道称,唐纳德·特朗普在 Truth Social 上发布了大量虚假的 AI 生成图像,使政治传播与宣传之间的界限变得模糊。文章将这一趋势描述为一种新的“slopaganda”,即利用合成媒体大规模塑造公众认知。
这很重要,因为 AI 生成的视觉内容可以迅速传播具有说服力的政治叙事,同时让受众更难判断真伪。它也表明竞选传播正在发生更广泛的转变,合成图像可能成为吸引注意力、进行说服和传播误导的常规工具。
《金融时报》分析了唐纳德·特朗普在 Truth Social 上如何成为 AI 生成虚假图像的传播渠道。文章并没有把这些图像当作零散的奇观,而是认为它们代表了政治传播方式的更大变化。报道指出,合成视觉内容正越来越多地被用来传递信息、强化叙事并激发反应。文章用“slopaganda”这个词来概括低质量 AI 内容与宣传意图的结合。
文中强调,其重要性不仅在于图像本身,更在于这些内容如何被扩散给支持者和反对者。特朗普持续发布这类素材,也在帮助政治领域逐步接受合成媒体。文章把这视为“什么算可接受的政治信息传播”边界的一次移动。它还暗示,随着生成图像变得越来越容易,未来的误导性传播活动可能会更便宜、也更频繁。
这篇文章关注的是特朗普在 Truth Social 上使用 AI 制作的虚假图像,而不是某个新的技术模型或产品发布。其关键在于,政治影响更多来自传播方式和叙事包装,而不是底层生成媒体工具本身的复杂程度。
Financial Times AI
《金融时报》这篇文章认为,AI 行业的大型 IPO 可能不只是为市场创造新的上涨空间,而是把投资风险从私募阶段的支持者转移给散户投资者。换句话说,AI 热潮中的上市公司,可能更多是在为早期投资者提供退出通道,而不一定意味着真正的广泛价值创造。
如果 AI 相关 IPO 的定价主要建立在炒作之上,那么一旦增长或利润没有达到预期,散户投资者可能就会承担下行损失。这不仅关系到 AI 公司及其融资方,也关系到人们如何理解繁荣周期会怎样重新分配风险。
《金融时报》这篇题为《AI 热潮中的不可能数学》的文章,对当前 AI 公共市场热情持怀疑态度。文章的核心观点是,AI 行业即将出现的大型 IPO,未必主要代表着企业基本面足够强,而可能更多是在把投资风险从早期私募投资者和内部人手中转移到公开市场的散户买家身上。作者认为,这场热潮背后的“数学”很难与市场给出的估值相匹配。尤其当投资者是在 AI 热度推动下买入,而不是基于已经被验证的长期经济回报时,这种矛盾就更加突出。
文章把这一现象放在更大的讨论框架中:AI 是否真的在足够快地产生企业价值,以证明流入该领域的巨额资本是合理的。它还指出,IPO 周期常见的一个特征是,当市场情绪高涨时,后进入的公开市场投资者往往会接住前期投资者已经回避掉的下行风险。按照这篇文章的逻辑,最终呈现出来的并不只是一次普通的上市,而更像是一种风险重新分配。
文章的核心观点是,大型行业 IPO 可能把风险转移给二级市场买家,尤其是更容易受市场动量和品牌知名度影响、而不是基本面影响的散户投资者。这个说法也呼应了更广泛的 IPO 市场担忧:炒作和“害怕错过”情绪会推动高风险参与,并削弱对估值的约束。
Financial Times AI
在一次采访中,Harvey 联合创始人 Winston Weinberg 表示,AI 可能会迫使律师事务所重新思考向客户收费的方式。他还谈到了 Harvey 将如何在法律 AI 工具日益普及的情况下保持竞争力。
如果 AI 让法律工作变得更快、更便宜,传统按小时计费模式可能会在整个法律行业面临压力。这将影响律师事务所、企业法务团队,以及试图自动化重复性工作的法律科技初创公司。
这篇报道围绕 Harvey 联合创始人 Winston Weinberg 的观点展开:AI 可能会重塑律师事务所的赚钱方式。他认为,如果软件能够承担更多传统上按小时计费的法律工作,律所就可能不得不放弃单纯按时间收费的模式。文章将这一变化描述为法律服务市场的结构性转变,而不只是 Harvey 自身的机会。根据搜索结果,Harvey 被描述为面向律师和企业法务团队的生成式 AI 产品。
该公司把自己的平台定位为一个安全工具,帮助用户处理高价值的法律工作,而不是一个通用聊天机器人。报道还提到,随着更多机构开始采用 AI 工具,Harvey 需要思考如何保持领先优势。整体来看,这篇文章重点不在新功能,而在于 AI 可能如何改变法律工作流程、客户预期以及法律咨询的商业逻辑。
Harvey 被定位为面向法律和专业服务市场的生成式 AI 产品,主要服务律师事务所和企业法务团队。这个报道讨论的是商业模式变化,而不是新的产品发布或技术突破。
OpenAI News
Ramp 工程师正在使用结合 GPT-5.5 的 Codex 来审查代码并更快地交付改进。该公司表示,这让他们能在几分钟内获得有实质内容的反馈,而不是等待数小时。
这展示了 AI 工具在软件开发流程中减少阻力的一种实际用法。如果效果可靠,更快的代码审查可以缩短迭代周期,并帮助团队减少发布延迟。
Ramp 表示,其工程师正在使用结合 GPT-5.5 的 Codex 来审查代码,并更高效地交付改进。根据这段描述,最主要的收益是工程师可以在几分钟内获得有实质内容的反馈,而不必等待数小时。这个故事把 Codex 描绘成开发流程中的实用助手,而不是一则独立的产品发布公告。重点在于 AI 如何加速代码审查,而代码审查往往是软件交付中的一个瓶颈。
该案例被定位为 Ramp 的工程效率实践。所给文本没有提供技术基准数据、工作流图示或限制条件。 因此,这一说法应被理解为一篇由厂商发布的使用案例,反映的是感知到的生产力提升。
这里强调的是更快的审查反馈,而不是新的模型发布或 Codex 本身的变化。该说法来自 Ramp 的工程实践案例,因此反映的是一家公司的经验,而不是广泛基准测试结果。
Simon Willison
Simon Willison 表示,2026 年 Google I/O 里大多数公告都还是“即将推出”,因此很难马上验证效果。 他认为最值得注意的是 Gemini 3.5 Flash、即将发布的 Gemini Spark 个人 AI 代理,以及 Google 用闭源的 Antigravity CLI 取代 Gemini CLI。
Gemini Spark 看起来是 Google 在智能体 AI 方向上的下一步重要布局,因为它被设计为可以直接连接 Gmail、Calendar、Drive、Docs、Sheets、Slides、YouTube 和 Google Maps 等核心服务。CLI 的切换也很重要,因为这意味着 Google 从开源工具转向闭源产品,可能会影响依赖其 AI 订阅计划和命令行工作流的开发者。
Simon Willison 说,今年的 Google I/O 很难写,因为他的原则是不报道自己无法亲自试用的功能。 他指出,Google 许多最重要的公告都还停留在“即将推出”的阶段,而他更倾向于等到正式可用再评论,因为预览版和最终版有时会有很大差异。 在这些内容里,他认为最具体、最容易评估的是 Gemini 3.5 Flash,因为它已经可以被观察和测试。 另一个最吸引他的重点是 Gemini Spark,Google 将其描述为个人 AI 代理,可以原生连接 Gmail、Calendar、Drive、Docs、Sheets、Slides、YouTube 和 Google Maps。 Willison 还注意到 FAQ 中有一条很奇怪的说明,说 Gemini Spark 运行在 Gemini 3.5 Flash 和 Antigravity 之上,这让他不太明白为什么需要在 FAQ 里特别提到 Antigravity。
他查看了 Antigravity 网站,发现其中包括桌面应用、基于 Go 的 CLI 代理工具、一个封装了闭源 Go 二进制文件的 Python SDK,以及原本的 Antigravity IDE,也就是一个 VS Code 分支。 他猜测 Spark 这个面向用户的托管代理产品可能就是在后台使用那个 Go 二进制文件,但并不确定。 此外,他也去寻找 Spark 如何应对 prompt injection 的安全说明,并在一篇面向企业客户的 Google Cloud 博文中找到说法:Spark 运行在完全托管的安全运行时中,每个任务都会在全新的、严格隔离的临时虚拟机里执行,所有流量都会经过执行 DLP 策略的 Agent Gateway,而用户凭据会被加密保存且不会直接暴露给代理。 最后,他还提到 Google 宣布 Gemini CLI 将从 6 月 18 日起不再支持 AI 订阅计划,并由新的闭源 Antigravity CLI 取代。
Willison 提到 FAQ 中一个令人困惑的说明:Gemini Spark 运行在 Gemini 3.5 Flash 和 Antigravity 之上,这暗示面向用户的代理可能依赖一个单独的 Go 运行时。 他还引用了 Google 面向企业的安全说法,称 Spark 使用隔离的临时虚拟机、安全的 Agent Gateway、DLP 策略和加密凭据,以降低提示注入和数据泄露风险。
TechCrunch AI

NanoCo 是安全导向的 OpenClaw 替代品 NanoClaw 的开发公司,在 Valley Capital Partners 领投下完成了超额认购的 1200 万美元种子轮融资。创始人还表示,在 NanoClaw 走红后,他们拒绝了一个据称约 2000 万美元的收购报价。
这则故事显示,一个解决真实痛点的开源安全工具,一旦获得关注,就能迅速吸引用户、投资人和收购兴趣。它也反映出行业正转向沙箱化、更安全的智能体工作流,而不是让工具直接获得广泛的服务和凭据访问权限。
NanoCo 是 NanoClaw 的开发公司,在一次病毒式传播后完成了 1200 万美元的种子轮融资。该轮融资由 Valley Capital Partners 领投,Docker、Vercel、Monday.com、Slow Ventures 以及 Hugging Face CEO Clem Delangue 等天使投资人参与其中。Gavriel Cohen 说,公司的发展速度非常惊人:他从在沙发上写代码开始,到不到六周就拿到 term sheet。与此同时,他们还收到了一份据称约 2000 万美元的收购报价,但他和共同创始人兼兄弟 Lazer Cohen 拒绝了这份报价。NanoClaw 最初是为兄弟俩之前的 AI 营销创业公司开发的,它的目标是提供一个更安全的 OpenClaw 替代方案。
与直接运行在电脑上、能够访问各种服务和凭据的工具不同,NanoClaw 运行在容器沙箱中。这个想法起初并不常见,但在 Andrej Karpathy 公开称赞,以及新加坡外长在 Facebook 上将其称为“第二大脑”并引发传播后,项目迅速升温。随后,来自几十位投资人和创始人的私信与邮件涌入,Docker 和 Vercel 也开始与他们接洽。现在,NanoCo 已经开始争取企业客户,因为早期用户多为技术能力较强的人,他们的同事不断要求帮助部署同样的系统,因此公司开始提供实施支持。
Gavriel Cohen 表示,从写下第一行代码到拿到 term sheet 不到六周,Andrej Karpathy 和新加坡外长的公开背书帮助它迅速走红。NanoClaw 以容器沙箱方式运行,而 NanoCo 现在也开始面向企业客户销售,因为用户不断要求部署和实施支持。
The Decoder

Google 正在测试 AI Studio 的新功能,允许用户在浏览器中通过文本提示直接生成简单的原生 Android 应用。这些应用使用 Kotlin 和 Jetpack Compose 构建,并且可以在浏览器内的 Android 模拟器中进行测试。
这意味着日常软件的一部分可能从应用商店转向按需生成,从而削弱通用工具类应用的需求。它也暗示着更大的平台转变:用户会越来越多地创建狭窄、个人化的工具,而不是去搜索和订阅现成软件。
Google 在 I/O 2025 上展示了 AI Studio 的新功能,允许用户在浏览器里通过提示词直接构建原生 Android 应用。文中提到,这些应用使用 Kotlin 和 Jetpack Compose 生成,并且可以在浏览器中的 Android 模拟器里运行和测试。Google 目前将这一能力定位为个人用途,未来计划支持与家人和朋友分享。文章认为,这不只是一个开发者便利工具,因为它可能改变简单软件的发现、分发和消费方式。若用户能在几分钟内生成待办清单、饮水记录、GPS 日志或打包清单,就会减少为这类一次性需求打开 Play Store 的必要。
这样一来,传统应用市场之下可能会出现一层“个人软件”新类别,专门承载非常具体、短期或只对少数人有用的应用。文章把这一趋势与企业软件领域的 “SaaSpocalypse” 讨论联系起来,认为 AI 代理和 vibe coding 可能削弱传统按席位、按应用收费的软件模式。与此同时,文章也强调 Google 并不是要消灭应用生态,而是在让用户生成小型个人应用的同时,通过 Gemini AI 助手把用户导向专业应用。结论是,软件本身不会消失,但简单、可替代界面的包装方式可能会受到冲击。
目前该功能主要面向个人使用,Google 计划后续支持与家人和朋友分享。Google 表示这些应用可以调用 GPS、Bluetooth 和 NFC 等传感器,这让它们比简单原型更实用,但仍然主要服务于简单的定制任务。
The Verge AI

在 Google I/O 上,DeepMind 首席执行官 Demis Hassabis 表示,Google 希望“重新构想药物发现流程,目标是在某一天解决所有疾病”,并将其放在 Gemini for Science 的框架下介绍。《The Verge》认为,这种说法需要更多上下文,更像是愿景式表述,而不是具体的医疗突破。
这一说法凸显出 AI 正在更深地进入药物研发和生物医学研究领域,而哪怕是小幅效率提升,也可能加速原本需要数年的工作。它也暴露出医疗 AI 宣传过度的风险,因为公众表达很容易把“加快研究”误解成“真正治愈疾病”。
《The Verge》这篇 Optimizer 专栏回应的是 Google I/O 上 DeepMind 首席执行官 Demis Hassabis 的一句话:公司希望“重新构想药物发现流程,目标是在某一天解决所有疾病”。文章认为,这类表述听起来非常宏大,但需要放回上下文中理解。作者解释说,Hassabis 实际上是在介绍 Gemini for Science,一组用于帮助研究人员探索和发现新知识的实验性 AI 工具。文章指出,科学界听到这番话,可能会理解为 AI 正在显著缩短医学发现所需的时间,但普通公众很容易把它听成“AI 会治愈所有疾病”。作者强调,这并不是现实世界里医学突破的运作方式。
文章还把这次发言放在更长的 AI 医疗研究历史中看待,指出 AI 早已用于可穿戴设备算法、基于机器学习的检测功能以及其他研究流程。文中引用一项元分析称,AI 在减少新冠疫苗研发时间方面发挥了重要作用,但同时也提醒,算法偏见、数据隐私、监管和全球公平获取等问题仍然存在。随后,文章以 AlphaFold 为例说明 AI 在科学中的实际价值:它帮助研究人员理解蛋白质结构,并被用于疟疾疫苗、LDL 相关蛋白和早发帕金森病研究。最后,文章提到 AlphaGenome 是一个用于预测人类 DNA 序列突变影响的模型,但 Google 自己也承认,它并未被验证用于个人基因组预测,而且在捕捉细胞和组织特异性模式方面仍有明显局限。
文章提到 AlphaFold 和 AlphaGenome 是 Google 科学工具的代表:AlphaFold 帮助研究人员理解蛋白质结构,而 AlphaGenome 用于预测人类 DNA 序列中的突变影响。文章同时指出 AlphaGenome 仍有重要限制,包括它并未经过验证,也不是为个人基因组预测而设计,而且难以捕捉细胞和组织特异性的模式。
The Verge AI
The Verge 认为,vibe 编程正在从桌面工具转向手机端应用开发,而 Google I/O 则表明这一趋势正在获得更多支持。Google 正在更新 AI Studio,让用户在几分钟内创建原生 Android 应用并导出到手机;同时,Google 还宣布了可通过提示词创建小组件的功能,据报道 Apple 也在探索基于提示词生成快捷指令。
如果这些功能表现良好,它可能会让非开发者更容易创建手机应用,并推动手机朝着更强个性化的方向发展。它也表明,主要平台厂商正在把生成式 AI 直接嵌入移动端核心工作流,而不只是停留在桌面上的编程助手。
The Verge 认为,所谓“vibe 编程”——也就是借助 AI 而不是传统手写代码来创建软件——已经不再只是桌面端工具的玩法,而是在向手机端扩展。文章指出,这一变化在 Google I/O 2026 上变得更加明显,因为 Google 展示了多项面向移动设备的 AI 功能。最重要的发布之一,是 Google 更新了 AI Studio,使用户能够在几分钟内创建一个原生 Android 应用并导出到手机。Google 表示,这项功能一开始只面向“个人工具”类应用,而且不会改变 Play Store 现有的上架规则。文章认为,这对那些想要一个现有应用都没有提供的特定功能的人很有吸引力,比如某种习惯追踪器或其他小众工具。
Google 还宣布了一个通过提示词创建小组件的功能,示例包括突出显示特定天气数据的小组件,以及推荐新食谱的小组件。作者指出,这些能力依赖 Gemini 的知识库,因此如果系统真的能按宣传那样工作,定制空间会非常大。Google 把 AI 生成的小组件称为迈向“生成式 UI”的第一步,也就是手机能根据用户当下需求即时生成界面。Android 总裁 Sameer Samat 表示,公司并不希望设备每天醒来后界面都完全不同,但认为用户级别的个性化和定制仍然有很大价值。文章最后提到,Apple 似乎也在朝类似方向前进;据 Bloomberg 的 Mark Gurman 报道,Apple 正在研究基于提示词创建快捷指令的方法。
Google 表示,这项 Android 应用创建功能目前仅限于“个人工具”类应用,Play Store 的上架规则也没有变化。文章还指出,小组件和“生成式 UI”的想法很大程度上取决于系统是否真的稳定可用,而 Google 自己也提醒,不希望设备界面每天都变化得太夸张。
The Verge AI

YouTube 推出了新的 Shorts Remix 选项“reimagine”,它使用 Gemini Omni 来重风格化或修改短视频。用户可以提示它把视频变成像素风、动漫或伪纪录片恐怖片等风格,甚至还能把自己或其他视觉元素插入视频中。
这把生成式 AI 直接带入了主流消费级视频功能,让普通用户也能更轻松地进行高级编辑和混剪。与此同时,它也带来了创作者控制权和同意方面的重要问题,而 YouTube 通过可关闭功能和水印来应对。
Google 宣布为 YouTube Shorts 推出新的 Remix 功能,让用户可以借助 Gemini Omni 对已有短视频进行重风格化。观看 Shorts 时,用户点击底部的 remix 图标后,会看到一个新的“reimagine”选项。进入后,用户可以让 Gemini 把视频改成像素风、动漫风,或者伪纪录片恐怖片等风格。这个功能不只是改变视觉风格,还可以直接修改视频内容。
Google 举例说,它可以把头部放大、插入背景演员、给人物换上海盗服装,甚至把用户本人放进视频里。创作者可以控制自己的 Shorts 是否允许被 reimagine,因此如果不希望作品被他人改动,可以关闭 remix。Google 还表示,所有通过 Omni 混剪的 Shorts 都会带有数字水印,并链接回原始视频。整体来看,这项更新把 Gemini Omni 作为一个面向普通用户的创作工具,直接集成进了 YouTube 的消费级产品中。
该功能会出现在 Shorts 视频底部的 remix 图标中,用户选择“reimagine”后即可向 Gemini Omni 提交提示词。YouTube 表示,经过 Omni 混剪的视频会带有数字水印并链接回原始视频,而创作者也可以为自己的上传内容关闭 remix 功能。
ZDNET AI

·#ai
在 Linux Foundation 的 Open Source Summit North America 上,Linus Torvalds 表示,AI 工具正在增加 Linux 内核的提交量,但也带来了新的社交和安全问题。他强调,AI“是个很棒的工具,但它只是个工具”,并不是程序员的替代品。
托瓦兹的观点之所以重要,是因为 Linux 内核处于互联网基础设施和开源开发实践的核心位置。他的发言表明,AI 已经在改变整个软件生态中的贡献者工作流、漏洞筛选以及安全披露规范。
在 Linux Foundation 的 Open Source Summit North America 上,Linus Torvalds 讨论了现代 AI 工具如何改变 Linux 内核开发。他说自己对 AI 有一种“又爱又恨”的关系,并强调 AI 是强大的辅助工具,而不是人类程序员的替代品。Torvalds 表示,自从迁移到 Git 之后,内核的发布流程大约 20 年来一直非常稳定,但过去六个月里,这种模式因为 AI 编程工具的进步而发生了变化。他估计,最近两个内核版本的提交量,比过去多年同期平均水平高出了约 20%。起初,他以为提交量激增是因为大家对重大版本变化很兴奋,但后来他认为,真正原因是 AI 工具已经足够好,能够让更多人参与进来。
Torvalds 指出,这些工具降低了贡献门槛,并能完成相当大一部分工作,但开源项目最棘手的问题往往不是纯技术问题,而是社会协作和流程变化。一个突出的麻烦是 Linux 内核安全邮件列表,他说那里最近被 AI 生成的重复报告“淹没”了。为此,他公布了新的安全披露指导原则:如果一个安全漏洞是借助 AI 发现的,基本上应当视为公开,因为其他很多人也可能借助 AI 找到它。他同时警告研究人员不要公开可用的利用代码,也不要公开炫耀自己如何造成破坏。Torvalds 还把这些问题放到更大的安全环境变化中来看,认为 AI 加速分析让漏洞及其影响的暴露速度远快于过去。
托瓦兹表示,在最近两个发布版本中,内核提交量比过去多年大约增加了 20%,他认为这与 AI 编程工具变得足够好、让更多人能够使用有关。他还说,内核安全邮件列表被大量由 AI 生成的重复报告淹没,因此推出了新的披露指南,认为用 AI 发现的安全漏洞基本上应视为公开信息。
ZDNET AI

ZDNET 报道了 Visa 的一项新研究,指出 AI 加速的诈骗已经成为增长最快的消费者伤害来源。报告称,诈骗正在从盗取账号凭证转向诱导受害者自己授权付款。
这很重要,因为授权支付诈骗很难用传统安全工具拦截:受害者自己完成了转账,银行往往会把它视为正常交易。随着 AI 通过伪造语音、深度伪造和生成式消息让骗局更逼真,消费者和金融机构面临的风险都在上升。
ZDNET 表示,Visa 的最新研究展示了 AI 正在如何改变网络犯罪与防御方式。文章的核心警告是,诈骗正在从盗取凭证和接管账号,转向利用社会工程诱导人们亲自批准恶意交易。文中把这种手法类比为 ClickFix:受害者以为自己在解决一个简单问题,实际上却被引导去执行有害操作。放到金融场景里,这可能意味着输入一次性验证码、在应用中批准付款,或者点击一个看似正常的确认按钮。
由于是用户自己授权了交易,这类损失往往会被视为“授权支付”,而不是普通黑客入侵。Visa 表示,诈骗者正在利用 AI 生成的诈骗内容、语音冒充和深度伪造媒体,让虚假请求听起来和看起来更可信。报告称,这种变化迫使金融机构重新思考欺诈检测策略,从单纯盯住被盗数据,转向识别和阻断欺骗行为。Visa 还表示,2025 年下半年其检测到近 10 亿美元的诈骗相关活动,其中包括冒充可信品牌、带有紧迫感的钓鱼攻击,以及诱导受害者自己完成交易的骗局。
Visa 表示,其《2026 年春季双年度威胁报告》发现,2025 年 7 月至 12 月间与诈骗相关的活动接近 10 亿美元。Visa 认为,行业需要从“检测被盗凭证”转向“检测并阻断欺骗”,其中也包括类似 ClickFix 的社会工程诈骗。
ZDNET AI

Google在其I/O开发者大会上发布了Universal Cart,这是一项购物功能,允许用户将来自多个零售商的商品合并到一个结账流程中。公司表示,由Gemini驱动的代理式AI会在后台运行,用于推荐商品、发现优惠并帮助完成交易。
这标志着Google进一步进入代理式商业领域,即AI系统不只是推荐商品,还能主动帮助执行购买。如果被广泛采用,它可能减少消费者的结账摩擦,同时让零售商以新的方式影响转化率并实现个性化优惠。
在Google I/O上,Google发布了一项名为Universal Cart的新购物功能,作为其一系列搜索和商业更新的一部分。Universal Cart的设计目标是让购物者把来自多个零售商的商品集中到一个地方,而不必在不同商店之间分别管理多个购物车。Google表示,这项功能建立在Universal Commerce Protocol之上,这是一种开放的商业与代理式AI标准,由Google与Target、Shopify、Wayfair和Etsy等大型零售商共同开发。该协议旨在让商家通过Google Pay运作,同时保留会员积分计划和信用卡选项等零售商专属信息。
Google称,基于Gemini的代理式AI会在后台运行,帮助推荐购买、展示相关促销信息,并辅助用户做决定。演示中,AI曾提醒用户CPU和主板不兼容,还指出了使用另一张信用卡可以获得折扣。文章将这些能力描述为Google减少“加入购物车”到“完成结账”之间摩擦的一部分,让购物过程更自动化,也更个性化。更长远的目标,是让用户用自然语言向AI下达指令,并由AI代为完成日常购买任务。
Universal Commerce Protocol被描述为与Target、Shopify、Wayfair和Etsy等零售商共同开发的开放标准,旨在配合Google Pay使用,同时保留会员积分计划和信用卡等零售商专属数据。Google还演示了AI识别不兼容部件(例如CPU和主板不匹配),并在结账时建议使用更合适的信用卡或发现更优优惠。
ZDNET AI

Canonical 发布了 Ubuntu Core 26,这是其面向 IoT 和边缘设备的最小化、不可变 Linux 的最新长期支持版本。它被设计为可安全、稳定地运行到 2041 年,更新通过已签名的 snap 交付。
这对需要让系统多年无人值守运行的组织很重要,尤其适用于 IoT、工业、机器人和边缘 AI 场景。15 年支持周期和不可变模型有助于降低维护风险,并满足欧盟《网络弹性法案》等安全与合规要求。
Canonical 的 Ubuntu Core 26 是其最新的长期支持版本,面向精简、不可变的 Linux 平台,主要用于 IoT 和边缘部署。它不同于通用的 Ubuntu 桌面版或服务器版,内核、基础系统和应用都以 snap 形式交付,因此每个组件都处于沙箱中,并经过加密签名。Canonical 表示,这种模式特别适合需要多年无人值守运行的设备,包括工业系统、机器人、数字标牌、家电以及低延迟 AI 工作负载。公司将安全性和合规性作为重点,强调欧盟《网络弹性法案》对软件来源可追溯性、长期稳定性和全栈责任的要求。Canonical 还表示,Ubuntu Core 26 可以安全运行到 2041 年。
一个重要的运维改进是新的 snap-delta 格式,它可将许多 OTA 更新大小减少 50% 到 90%,而 Core 基础 snap 的体积从大约 16 MB 缩小到约 1.5 MB。该版本还采用基于 initramfs 的安装流程,默认避免不必要的重启,从而让设备部署更快、更可预测。另一个显著变化是基于 Chisel 的基础 snap 构建系统,Canonical 称这能通过明确的 slice 定义和源包映射提升可追溯性,同时将基础镜像体积减少约 7%。在启动层面,Ubuntu Core 26 将 u-boot 配置移到单一原始分区并支持冗余环境;在全盘加密方面,它把 TPM 封存密钥直接存入 LUKS2 头部,并引入原生 OP-TEE 集成,为基于 ARM TrustZone 的密钥保护提供支持。
Ubuntu Core 26 将内核、基础系统和应用都通过沙箱化、经过加密签名的 snap 交付,并保持度量启动链。该版本还引入了更小的 OTA 更新、基于 initramfs 的安装路径、基于 Chisel 的新基础 snap 构建系统,以及改进的磁盘加密方案,包括 TPM 封存密钥和原生 OP-TEE 支持。
ZDNET AI

ZDNET 报道称,Verizon 的 2026 年数据泄露调查报告指出,移动钓鱼现在已经超过了基于电子邮件的钓鱼。Verizon 发现,语音钓鱼和短信诈骗等以移动设备为中心的攻击,点击率高于传统邮件诱饵。
这很重要,因为安全团队长期以来主要关注邮件过滤和邮件安全意识培训,但攻击者正越来越多地通过手机、短信和电话接触用户。组织可能需要把培训和防御重点转向移动优先的社交工程风险,尤其要防范针对财务、客服台和高管冒充的诈骗。
ZDNET 表示,Verizon 最新的 DBIR 显示钓鱼手法正在发生明显转移:以移动设备为入口的攻击已经超过了邮件威胁。报告认为,随着人们越来越善于识别传统钓鱼邮件,犯罪分子正在转向短信、电话以及其他基于移动设备的社交工程方式。Verizon 的分析基于 2025 年超过 31,000 起真实安全事件,以及来自 145 个国家、22,000 起已确认的数据泄露。报告还指出,在已知泄露事件中,“人为因素”出现在 62% 的案例里,同比上升了 2%。
Verizon 还称,社交工程占全部泄露事件的 16%,仍然是数据窃取、支付欺诈、勒索软件和敲诈勒索的重要入口。钓鱼模拟测试显示,语音钓鱼和短信诈骗等移动端诱饵的点击率比邮件钓鱼高出 40%。文章提到,预设情境欺骗(pretexting)也越来越常见,也就是攻击者先冒充高管、供应商、客服台人员,甚至家人建立信任,再诱导受害者做出有害操作。文章给出的核心结论是,企业不能再把邮件防护当作唯一重点,而应把培训和防御扩展到移动通信渠道。
Verizon 表示,这些结论基于 2025 年超过 31,000 起真实安全事件,以及来自 145 个国家的 22,000 起已确认数据泄露。在钓鱼模拟中,以移动设备为中心的诱饵点击率约为 2%,而邮件钓鱼约为 1.4%,高出 40%。