AI 日报

Google I/O 把 Gemini 推向智能体时代,搜索、创作与商业入口全面重构

今天的主线非常清晰:Google 正在把 Gemini 从模型家族升级为覆盖搜索、创作、开发、购物和设备的智能体平台。I/O 2026 的一系列发布显示,AI 竞争的焦点已经从“谁更会回答”转向“谁更能替用户完成工作”。

当天导读

从 82 条资讯中筛选出 52 条

今天的主线非常清晰:Google 正在把 Gemini 从模型家族升级为覆盖搜索、创作、开发、购物和设备的智能体平台。I/O 2026 的一系列发布显示,AI 竞争的焦点已经从“谁更会回答”转向“谁更能替用户完成工作”。

AI 代理开始进入购物与支付闭环

Universal Cart 与 AP2 把 AI 从推荐层推进到交易层,Google 正试图让代理代表用户完成比较、提醒与付款。[1892][1907]

内容溯源与安全基础设施正在补课

OpenAI、Google 的 SynthID 扩展,以及 Cloudflare 与 Anthropic 的沙盒集成,都说明行业正在同步建设可信与可控的 AI 基础设施。[1862][1881][1886][1891]

今日主题

Google I/O 2026 几乎把“agentic AI”变成了 Google 全产品线的默认方向:Gemini 3.5 Flash、Gemini Omni、Spark、Antigravity、Search 重设计、Universal Cart、Workspace 语音工具和智能眼镜,共同指向一个结论——Google 正在把 AI 从对话界面推进到执行层。[1856][1858][1860][1878][1892]

最重要的变化

  • 模型层:Gemini 3.5 Flash 被定位为兼顾速度、成本与前沿能力的智能体模型,面向消费者、开发者和企业全面开放。[1858][1863]
  • 界面层:Search 搜索框从关键词入口变成多模态 AI 入口,支持文本、图片、PDF、视频和标签页输入。[1861][1884][1895]
  • 代理层:Gemini Spark 和 Search 代理把“持续运行、后台监控、跨应用执行”变成 Google 的明确产品方向。[1878][1889]
  • 创作层:Gemini Omni、Pics 和 Workspace 新功能把图像、视频、文档和语音创作整合进同一套 AI 工作流。[1871][1888][1896]
  • 分发与变现:Universal Cart、AP2 和新的订阅分层说明 Google 正在把 AI 代理直接接入交易与付费体系。[1892][1894][1907]

今日解读

Google 的策略不是单点发布,而是把 Gemini 变成一层统一能力:模型负责推理,Search 负责分发,Workspace 负责生产力,Antigravity 负责开发,Spark 负责持续执行,Universal Cart 负责交易闭环。这个组合意味着 Google 想把 AI 变成用户日常数字生活中的默认操作系统,而不只是一个聊天框。[1856][1866][1874][1904]

业界信号

除了 Google 的密集发布,今天也出现了两条重要侧线:一是 Anthropic 的 Karpathy 入职强化了前沿模型人才竞争;二是 SynthID、C2PA 等内容溯源工具开始跨公司扩散,说明 AI 生态正在同步补基础设施与治理层。[1872][1873][1862][1886][1891]

其他值得注意

  • NextEra 拟以 670 亿美元收购 Dominion,显示数据中心电力需求正在重塑能源并购逻辑。[1864]
  • Cloudflare 与 Anthropic 的沙盒集成说明代理工作负载正在走向“推理层与执行层分离”。[1881]
  • Mistral 收购 Emmi AI,继续押注工业物理 AI 与欧洲企业市场。[1903]
  • OpenAI 与 Elon Musk 的诉讼进展提醒市场:AI 公司治理和法律结构仍是高压议题。[1901][1902]

参考故事

  1. [1856] Google I/O 2026开启Gemini智能体时代
  2. [1858] Google 发布 Gemini 3.5 Flash
  3. [1860] Google 搜索转向 AI 驱动
  4. [1861] Google 将搜索框重设计为 AI 多模态入口
  5. [1862] SynthID扩展到谷歌之外
  6. [1863] 谷歌 Gemini 3.5 Flash 让智能体 AI 更实用
  7. [1864] NextEra与Dominion合并瞄准数据中心需求
  8. [1865] 谷歌为搜索加入AI代理并筹备智能眼镜
  9. [1866] 谷歌以代理式 Gemini 愿景开启 I/O 2026
  10. [1871] 谷歌发布 Gemini Omni 跨模态视频生成
  11. [1872] Andrej Karpathy 加入 Anthropic 预训练团队
  12. [1874] Google 发布 Gemini 3.5 Flash、Omni 和常驻 Spark
  13. [1878] 谷歌推出 Gemini Spark AI 代理
  14. [1881] Claude 代理接入 Cloudflare 沙盒
  15. [1884] Google 用 Gemini 3.5 Flash 升级 Search
  16. [1886] OpenAI 推进 AI 内容溯源
  17. [1892] 谷歌推出 Universal Cart 并扩展代理支付
  18. [1894] Google 将 AI 订阅重组为三档
  19. [1896] Google将语音AI带入Gmail、Docs和Keep
  20. [1903] Mistral AI 收购 Emmi AI

当日精选 8 条

01

Google AI Blog

Google I/O 2026开启Gemini智能体时代

·#google-ai

Google I/O 2026开启Gemini智能体时代

Google I/O 2026推出了两款新模型:Gemini Omni 和 Gemini 3.5 Flash,同时把更多智能体能力扩展到 Google 的各类产品中。公司还重点介绍了 Google Antigravity 这一以智能体为先的开发平台,以及 Search 中的信息智能体、Gemini Spark、Daily Brief 和 Universal Cart 等新体验。

这表明 Google 正在把方向从“回答问题的 AI 助手”推进到“能够执行任务的 AI 智能体”,这可能重塑用户搜索、购物和软件开发的方式。它也显示 Google 正在把 Gemini 打造成覆盖消费产品和开发工具的统一能力层,这可能影响更广泛的 AI 平台竞争格局。

在 Google I/O 2026 上,Google 将最新发布概括为“Gemini 智能体时代”的开始。公司表示,AI 的作用正在从只会帮助写作的工具,转向能够真正执行任务的智能体。为实现这一转变,Google 发布了两款新模型:Gemini Omni 和 Gemini 3.5 Flash。Google 将 Gemini Omni 描述为在世界理解、多模态和编辑能力上的重大进步,并强调它可以从任意输入生成内容,最先支持视频输入。Gemini 3.5 Flash 则被介绍为新模型家族中的首个版本,结合了前沿智能和行动能力。

Google 还强调了 Google Antigravity 的进展,并称这是一个以智能体为先的开发平台,能够让更多人借助智能体完成软件开发工作。除了开发工具之外,Google 还表示正在把智能体和智能体式体验扩展到更多产品中。例子包括 Search 里的信息智能体、Gemini 应用中的 Gemini Spark 和 Daily Brief,以及作为智能购物车的 Universal Cart。公司同时表示,Gemini 还会继续扩展到更多产品和新形态,例如 Google Pics、智能眼镜和 Ask YouTube。整体来看,这次发布把 Gemini 定位成不仅是模型系列,更是 Google 生态中智能体体验的基础能力层。

Google 表示,Gemini Omni 能基于任意输入生成内容,并从视频场景开始,强调世界理解、多模态和编辑能力。Gemini 3.5 Flash 被描述为新一代模型家族中的首个版本,兼具前沿智能和行动能力,而 Google Antigravity 则被定位为面向端到端软件任务的智能体优先 IDE。

查看单篇正文查看原文
02

Google AI Blog

Google 发布 Gemini 3.5 Flash

·#llms

Google 发布 Gemini 3.5 Flash

Google 发布了 Gemini 3.5,这是一个把前沿智能与“行动能力”结合起来的新模型家族,并率先推出了 3.5 Flash。谷歌表示,3.5 Flash 现已面向 Gemini 应用、Google Search 的 AI 模式、Google Antigravity、Gemini API、AI Studio、Android Studio 以及企业版 Gemini 产品开放。

这次发布很重要,因为 Google 正在把 Gemini 3.5 Flash 定位为一种既足够快、又能胜任真实代理工作流的前沿模型,而不是单纯追求能力上限。它可能影响消费者搜索体验、开发者代理工具,以及那些同时在意成本、延迟和多步执行能力的企业自动化场景。

Google 宣布推出 Gemini 3.5,并将其描述为一个把前沿智能与行动能力结合起来的新模型家族,目标是推动更强大的智能代理。该系列的首个版本是 Gemini 3.5 Flash,谷歌称它在保持 Flash 系列一贯速度的同时,提供面向代理和编程任务的前沿性能。这个模型已经面向消费者开放,可通过 Gemini 应用和 Google Search 的 AI 模式使用。开发者则可以通过 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio 接入。企业用户可以在 Gemini Enterprise Agent Platform 和 Gemini Enterprise 中使用它。谷歌还表示,Gemini 3.5 Pro 已经在内部使用,预计下个月正式推出。

谷歌公布的基准测试显示,3.5 Flash 在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 和 CharXiv Reasoning 等项目上都超过了 Gemini 3.1 Pro。谷歌还称,它的输出 token 速度大约比其他前沿模型快 4 倍。公司借此强调,用户不再需要在质量和延迟之间做取舍。谷歌认为,这个模型尤其适合长周期代理任务,例如开发应用、维护代码库和准备财务文档。它还强调了与更新后的 Antigravity harness 结合后的能力,即在监督下让多个子代理协作完成多步骤工作流和编程任务。文章中的示例包括自动重命名和分类非结构化资产、在六小时内综合论文并编写可运行游戏、将旧代码库迁移到 Next.js,以及为 AI Studio 生成更丰富的网页界面和图形。

Google 表示,3.5 Flash 在多项基准上超过了 Gemini 3.1 Pro,包括 Terminal-Bench 2.1 的 76.2%、GDPval-AA 的 1656 Elo、MCP Atlas 的 83.6%,以及 CharXiv Reasoning 的 84.2%。谷歌还称它的输出 token 速度比其他前沿模型快约 4 倍,并计划在下个月推出已经内部使用中的 3.5 Pro。

查看单篇正文查看原文
03

TechCrunch AI

谷歌推出面向智能体的 Gemini 3.5 Flash

·#ai

谷歌推出面向智能体的 Gemini 3.5 Flash

谷歌在 2026 年 Google I/O 上发布了 Gemini 3.5 Flash,并将其定位为迄今最强的编程和自主 AI 智能体模型。公司称它可以独立执行代码流水线、管理研究项目,甚至在内部测试中从零构建操作系统。

这次发布表明谷歌正在从“聊天式 AI”转向更具行动能力的智能体 AI,让模型在更少人工监督下完成规划、执行和迭代。若其表现符合宣传,开发者、企业和普通用户在编程、研究与流程自动化中的用法都可能被改变。

谷歌在 2026 年 Google I/O 上发布了 Gemini 3.5 Flash,并将其定位为迄今最强的编程和自主 AI 智能体模型。公司称它可以独立执行代码流水线、管理研究项目,甚至在内部测试中从零构建操作系统。 这次发布表明谷歌正在从“聊天式 AI”转向更具行动能力的智能体 AI,让模型在更少人工监督下完成规划、执行和迭代。

若其表现符合宣传,开发者、企业和普通用户在编程、研究与流程自动化中的用法都可能被改变。 DeepMind 首席技术官 Koray Kavukcuoglu 表示,Gemini 3.5 Flash 在几乎所有基准上都超过了较新的 3.1 Pro,包括编程、智能体任务和多模态推理。谷歌还称它比其他前沿模型快 4 倍,且有一个在相同质量下快 12 倍的优化版本;这对需要并行处理、长时间运行的智能体工作流尤其关键。

DeepMind 首席技术官 Koray Kavukcuoglu 表示,Gemini 3.5 Flash 在几乎所有基准上都超过了较新的 3.1 Pro,包括编程、智能体任务和多模态推理。谷歌还称它比其他前沿模型快 4 倍,且有一个在相同质量下快 12 倍的优化版本;这对需要并行处理、长时间运行的智能体工作流尤其关键。

查看单篇正文查看原文
04

TechCrunch AI

Google 搜索转向 AI 驱动

·#google-search

Google 搜索转向 AI 驱动

在 Google I/O 2026 上,Google 发布了对搜索的重大重设计,核心是重新设计的智能搜索框。新的体验会在很多场景下用交互式 AI 体验、信息代理和个性化迷你应用取代传统的“十个蓝色链接”结果。

这清楚表明,搜索正在从“找链接”转向由 AI 代为完成任务。它可能改变用户获取信息的方式、出版商的流量来源,以及整个搜索和 AI 生态中的产品设计思路。

Google 在周二的 Google I/O 大会上宣布了搜索产品自 25 年多前搜索框诞生以来最大的一次变化。过去依赖“十个蓝色链接”的结果页,未来将越来越多地变成 AI 驱动的交互式体验。Google 还加入了可以代表用户收集并解释信息的“信息代理”,以及用于创建个性化迷你应用的工具。新的搜索框会直接支持更长、更接近自然语言的提问,而不是要求用户一开始就选择搜索模式。公司还推出了新的 AI 查询建议系统,目标是帮助用户构造更复杂、更细致的问题。

Google 表示,从周二开始,AI Overviews 还会在 AI Mode 中支持后续追问。Google 搜索负责人 Liz Reid 介绍说,信息代理可以按照特定参数配置,制定监控计划,并调用实时数据源,例如金融数据。它们会持续跟踪变化,在满足条件时发送综合更新,同时附上链接和可深入查看的信息。整体来看,这意味着“搜索网页”这件事将越来越由 AI 代理完成,而人类更多是根据这些结果采取行动。

Google 表示,新的搜索框会自动扩展,以支持更长、更自然的对话式查询,而不是让用户一开始就选择模式。公司还称,用户很快可以创建和管理多个信息代理,它们能持续监控网页、综合更新,并提供相关链接供进一步阅读。

查看单篇正文查看原文
05

VentureBeat AI

Google 将搜索框重设计为 AI 多模态入口

·#google-search

Google 将搜索框重设计为 AI 多模态入口

Google 在 I/O 2026 上宣布对搜索框进行重大重设计,把它从关键词输入框变成一个由 AI 驱动的输入界面,可接受文本、图片、PDF、视频以及 Chrome 标签页。与此同时,Google 还在把 AI Overviews 和 AI Mode 合并为一条统一的搜索流程。

这标志着数十亿用户与 Google 搜索的交互方式可能发生重大变化,产品重心从简短关键词查询转向多模态、对话式搜索。它也表明 Google 希望把其旗舰搜索体验变成面向网页信息发现的默认 AI 入口。

在过去 25 年里,Google 搜索框一直是计算领域最经典的界面之一:一个简单的白色输入框、闪烁的光标,以及一串蓝色链接。Google 表示,在周二它将正式告别这一模式,并在 I/O 开发者大会上推出一次全面重设计。新的搜索框不再只是输入关键词的地方,而是被设计成一个由 AI 驱动的“对话起点”,可以直接接受文本、图片、PDF、视频,甚至打开的 Chrome 标签页作为输入。Google 还计划把 AI Overviews 和 AI Mode 合并,让用户不必在传统搜索结果页和 AI 优先体验之间做选择。Google 搜索副总裁兼负责人 Liz Reid 在周一的发布会上称,这次改版是搜索框自 25 年前诞生以来最大的升级。

新的界面会动态扩展,以容纳更长、更详细的提问,并提供 AI 驱动的建议,帮助用户组织更复杂、更细致的问题。此前,一些多模态输入能力已经存在于 AI Mode 中,但现在它们被放到了搜索的主入口。Google 表示,这项改版会立即在所有已支持 AI Mode 的国家和语言中开始推送。文章认为,这可能是本次 I/O 最具影响力的宣布之一,因为它表明 Google 正在把搜索重新定义为一个基于全网内容的多模态 AI 界面,而不只是关键词检索工具。

新的搜索框会动态扩展,以容纳更长、更口语化的提问,并加入一种超越自动补全的 AI 查询建议系统,引导用户提出更复杂的问题。Google 表示,这项改动会立即在所有已提供 AI Mode 的国家和语言中开始推送。

查看单篇正文查看原文
06

Ars Technica AI

SynthID扩展到谷歌之外

·#ai-watermarking

SynthID扩展到谷歌之外

谷歌表示,其 SynthID AI 水印技术正在被包括 OpenAI 和 Nvidia 在内的公司采用。谷歌还称,SynthID 目前已用于标记 1000 亿张图片和视频,以及相当于 6 万年时长的音频。

这标志着 AI 内容溯源标准朝着更广泛的行业共识迈出一步,因为用户和平台都需要更可靠的方法来识别合成媒体。如果主要模型和硬件提供商采用相同的标记方式,可能会提升整个生态中的信任、审核和归因能力。

谷歌表示,其三年前首次展示的 SynthID 水印系统正在走出谷歌自家产品,开始被 OpenAI、Nvidia 等外部公司采用。谷歌称,这套系统已经被大规模使用,累计为 1000 亿张图片和视频、以及 6 万年时长的音频打上标记。随着 AI 生成图片和视频越来越逼真,用户越来越难分辨哪些内容是真实拍摄、哪些是合成生成,这也促成了这项更新。谷歌的做法是把 SynthID 与 C2PA 溯源标准结合起来使用。C2PA 会附带描述内容如何创建和处理的元数据,谷歌已经在 Pixel 10 手机上更明显地使用这项标准。

对于 Pixel 设备拍摄的照片,元数据会记录处理过程;如果高度放大的图像中包含生成式元素,还会被标记为 AI 内容。谷歌还表示,未来几周内,Pixel 8、Pixel 9 和 Pixel 10 手机上的视频也会获得 C2PA 相关标签。与此同时,Gemini 也将加入 C2PA 扫描能力,帮助聊天机器人解释文件的来源,Chrome 和 Search 之后也会支持类似功能。与容易被删除或篡改的元数据不同,SynthID 会直接嵌入图片和视频的像素中,以及 AI 音乐和音频概览的波形中,包括 NotebookLM 生成的内容。谷歌 DeepMind 科学家 Pushmeet Kohli 表示,团队重点研究了如何让 SynthID 在压缩、裁剪和旋转等变换下仍然更难被移除。

SynthID 会将不可见水印直接嵌入 AI 生成的图片、视频、音频和文本中,谷歌表示它在压缩、裁剪或旋转后仍应保持可检测性。谷歌也在配合推进 C2PA 元数据方案,并计划在 Gemini、Chrome、Search 以及 Pixel 设备上提供更多支持。

查看单篇正文查看原文
07

Ars Technica AI

谷歌 Gemini 3.5 Flash 让智能体 AI 更实用

·#google-gemini

谷歌 Gemini 3.5 Flash 让智能体 AI 更实用

谷歌表示,Gemini 3.5 Flash 是一款具备前沿能力的模型,速度和效率都明显高于更大的同类模型,输出速度接近每秒 300 个 token。它正在向谷歌的多个产品落地,包括 Gemini 应用、API、AI Studio、Android Studio、企业产品以及 Antigravity 等内部系统。

只有当模型足够快、足够便宜,智能体 AI 才能真正支撑更长、更复杂的多步骤任务,而 Gemini 3.5 Flash 正是直面这一瓶颈。若谷歌的性能表现属实,开发者就能更大规模地构建更实用的代码生成、工具调用和界面操作工作流。

谷歌正在把 Gemini 3.5 Flash 定位为其持续迭代中的一次重要升级。核心主张是,这款模型在具备前沿级智能的同时,还足够高效,能够让长时间运行的智能体 AI 任务在大规模场景下变得可行。谷歌 Gemini 产品高级产品管理总监 Tulsee Doshi 表示,这些改进同时来自预训练和后训练,而用户与开发者的反馈也在塑造模型能力。谷歌称,这些提升已经体现在代码生成和工具使用能力上,而且未来 Flash 和 Pro 系列还会继续沿着这一方向演进。该模型的输出速度接近每秒 300 个 token,但在基准测试中的表现却接近更大、运行更慢的模型。

谷歌还表示,Gemini 3.5 Flash 在 Terminal Bench、SWE-Bench Pro 等代码相关测试,以及 OSWorld-Verified 这类通用计算任务测试中表现突出。公司内部已经部署了这款模型,并称其在谷歌自身代码库中的编程表现有“巨大跃升”。除了内部使用,Gemini 3.5 Flash 还会进入 Gemini 应用、API、AI Studio、Android Studio 以及谷歌的企业产品,而 Pro 版本已经在内部测试中,预计下个月发布。谷歌还推出了 Gemini Spark,这是一款专门的智能体,能够全天候运行在谷歌云端,并使用 Gemini Flash 3.5 在用户的整个 Google 生态中执行工作流。文章将这视为行业从聊天机器人转向更自治的智能体系统的大趋势之一。

谷歌称,3.5 Flash 在基准测试中的表现接近 3.1 Pro 等更大的前沿模型,但速度成本大约只有后者的四分之一,而且在代码生成和工具使用方面提升尤为明显。在 Terminal Bench、SWE-Bench Pro 和 OSWorld-Verified 等测试中,它显著优于旧版 Flash 模型,并在部分对比中接近 GPT 5.5 的水平。

查看单篇正文查看原文
08

Ars Technica AI

NextEra与Dominion合并瞄准数据中心需求

·#energy

NextEra与Dominion合并瞄准数据中心需求

NextEra Energy提出以670亿美元收购Dominion的合并交易,这将把按市值计算美国第一大和第六大公用事业公司合并为一家企业。该交易于周一上午公布,但仍需获得州和联邦监管批准。

如果获批,这笔合并将造就一家在发电、天然气发电和可再生能源领域都极具影响力的巨头,而数据中心需求正推动电力行业发生重大变化。批评者认为,这种规模会让监管更困难,也可能削弱对消费者的保护。

NextEra Energy提出以670亿美元收购Dominion,这将按市值把美国最大的公用事业公司与第六大的公用事业公司合并在一起。该交易于周一上午公布,但仍需州和联邦监管机构批准。合并后的公司将在美国电力行业的多个领域占据重要位置,包括发电、天然气发电以及可再生能源。此次交易把NextEra的规模与Dominion在北弗吉尼亚的地位结合起来,而北弗吉尼亚拥有全球最大的数据中心集群。由于数据中心用电需求激增,电力行业的规划和投资正在被重新塑造,这使得这笔交易更具战略意义。

文中引述的消费者权益倡导者和分析人士认为,这笔合并可能对消费者和环境不利,因为它会把更多财务和政治力量集中到一家更难有效监管的公司手中。哈佛法学院的Ari Peskoe表示,合并主要是为了股东利益,而不是为了用电客户利益,并指出如果交易完成,高管会获得巨额收益。晨星分析师Andrew Bischof则认为,从商业角度看,这笔交易有助于NextEra借助Dominion的本地经验和关系,加快其数据中心布局。NextEra总部位于佛罗里达州Juno Beach,旗下包括Florida Power & Light和NextEra Energy Resources;Dominion总部位于弗吉尼亚州里士满,服务弗吉尼亚及卡罗来纳州部分地区的受监管用户。

文章称,合并后的公司在北弗吉尼亚会特别强势,因为那里聚集着全球最多的数据中心,而Dominion已经是当地公用事业供应商。晨星分析师Andrew Bischof表示,这笔交易可能让NextEra借助Dominion的关系和经验,加快其数据中心布局。

查看单篇正文查看原文
09

Financial Times AI

·#google

谷歌为搜索加入AI代理并筹备智能眼镜

谷歌在 I/O 上表示,正在与 Warby Parker 和 Gentle Monster 合作推出新一代 AI 眼镜,并由三星参与设计,这些设备将兼容 Android 和 iOS,计划于今年晚些时候推出。公司还表示,新的 Gemini 模型将为搜索中的 AI 代理功能提供支持,Sundar Pichai 说此举旨在缩小与 Anthropic 和 OpenAI 的差距。

这意味着谷歌的 AI 战略不再局限于软件,还延伸到新的消费级硬件形态,Gemini 可能因此更像一个日常助手,覆盖搜索和可穿戴设备。若能成功,它可能强化谷歌在 AI 竞争中的地位,并改变用户与搜索、应用和数字服务的交互方式。

谷歌在 Google I/O 上宣布重新进入智能眼镜领域。公司表示,正在与 Warby Parker 和 Gentle Monster 合作推出一系列 AI 驱动的眼镜,三星也参与了这项设计工作。谷歌称,这些设备将能够与 Android 和 iOS 手机配对,并计划在今年晚些时候上市。谷歌将这类产品称为“音频眼镜”,强调的是语音交互,而不是完整的可视化计算界面。现场演示中,一名谷歌员工只通过对眼镜说话,就完成了在线点咖啡。

谷歌表示,这些设备将通过其更广泛的应用和服务生态运行,其中包括 Gemini。此次发布也让人联想到谷歌此前的 Google Glass,那个产品虽然知名,但最终因争议而失败。如今,智能眼镜市场已经吸引了大量投资,尤其是来自 Meta,以及一批创业公司和中小厂商。与此同时,谷歌还表示,新的 Gemini 模型将为搜索中的 AI 代理功能提供支持,显示出公司正试图在与 Anthropic 和 OpenAI 的竞争中缩小差距。

谷歌将这些眼镜称为“音频眼镜”,也就是用户可以直接口头发出指令,由设备通过包括 Gemini 在内的谷歌应用和服务生态来完成任务。演示中,一名谷歌员工仅通过对眼镜说话就完成了在线点咖啡,公司把这款产品定位为与手机同步的伴侣设备,而不是独立电脑。

查看单篇正文查看原文
10

Google AI Blog

谷歌以代理式 Gemini 愿景开启 I/O 2026

·#google-i-o

谷歌以代理式 Gemini 愿景开启 I/O 2026

在 Google I/O 2026 上,谷歌 CEO Sundar Pichai 将主题演讲定位为“agentic Gemini 时代”的开端,并概述了谷歌的全栈 AI 战略。他重点介绍了 Gemini 驱动的产品、Search、Gemini 应用、开发者 API 以及 Google Cloud 使用量的显著增长。

这表明谷歌希望把 Gemini 定位为不仅仅是一套模型,而是其产品、开发者平台和云业务的核心。相关规模数据也说明 AI 已经深度嵌入谷歌的消费级和企业级体系,这对主流 AI 采用方向具有重要指示意义。

在 Google I/O 2026 上,谷歌 CEO Sundar Pichai 将主题演讲定位为“agentic Gemini 时代”的开端,并概述了谷歌的全栈 AI 战略。他重点介绍了 Gemini 驱动的产品、Search、Gemini 应用、开发者 API 以及 Google Cloud 使用量的显著增长。 这表明谷歌希望把 Gemini 定位为不仅仅是一套模型,而是其产品、开发者平台和云业务的核心。

相关规模数据也说明 AI 已经深度嵌入谷歌的消费级和企业级体系,这对主流 AI 采用方向具有重要指示意义。 Pichai 表示,谷歌每月处理的 token 已超过 3.2 千万亿,较一年前约 4,800 万亿增长了 7 倍,也远高于两年前的 9.7 万亿。他还说,AI Overviews 的月活用户已超过 25 亿,AI Mode 在一年内突破 10 亿月活,Gemini 应用的月活也从 4 亿增长到超过 9 亿。

Pichai 表示,谷歌每月处理的 token 已超过 3.2 千万亿,较一年前约 4,800 万亿增长了 7 倍,也远高于两年前的 9.7 万亿。他还说,AI Overviews 的月活用户已超过 25 亿,AI Mode 在一年内突破 10 亿月活,Gemini 应用的月活也从 4 亿增长到超过 9 亿。

查看单篇正文查看原文
11

Hugging Face Blog

Hugging Face 发布六款 Ettin 重排序模型

·#information-retrieval

Hugging Face 发布六款 Ettin 重排序模型

Hugging Face 发布了六个基于 Ettin ModernBERT 编码器的 Sentence Transformers CrossEncoder 重排序模型,参数规模分别为 17M、32M、68M、150M、400M 和 1B。此次发布还附带了训练数据和完整训练方案,作者称这些模型在各自规模上达到了当前最优水平。

重排序模型是现代检索系统中的关键组件,提供多种规模的强模型可以让团队更灵活地在延迟、成本和排序质量之间做权衡。与此同时,连同模型和训练方案一起开源,也让这项工作更容易复现、迁移到自有数据并继续改进。

Hugging Face 发布了六个基于 Ettin ModernBERT 编码器的新 Sentence Transformers CrossEncoder 重排序模型。六个模型的规模分别是 17M、32M、68M、150M、400M 和 1B 参数。作者表示,这些模型在各自的参数规模上都达到了当前最优水平。除了模型本身,这次发布还公开了生成这些模型所用的数据和完整训练方案。训练方法采用蒸馏思路,在 cross-encoder/ettin-reranker-v1-data 数据集上,对 mixedbread-ai/mxbai-rerank-large-v2 的分数进行点式 MSE 学习。该数据集被描述为 lightonai/embeddings-pre-training 的一个子集与 lightonai/embeddings-fine-tuning 的一个重排序子集混合而成。

文章解释了 reranker,也就是点式 cross-encoder,是一种对查询和文档成对输入并输出相关性分数的模型。它与 embedding 模型不同,后者分别编码查询和文档,再通过向量相似度计算结果;cross-encoder 会让两段文本在每一层 Transformer 中相互注意,因此准确度更高,但计算成本也更高。由于它不能高效地遍历整个语料库,实际生产中通常采用“先召回、再重排”的流程:先用快速 embedding 模型找出候选,再用 cross-encoder 对前 K 个结果重新排序。博客还提到,这六个重排序模型与 google/embeddinggemma-300m 一起在 MTEB(eng, v2) Retrieval 上进行了评估,并且还展示了另外五种 embedding 模型搭配的结果。发布的模型是标准的 Sentence Transformers CrossEncoder,可以通过很少的代码调用 predict 或 rank 接口直接使用。作者最后说明,训练方案还借助了 Sentence Transformers v5.5.0 新增的 train-sentence-transformers Agent Skill,可通过 AI 编程代理来微调 SentenceTransformer、CrossEncoder 或 SparseEncoder 模型。

这些模型采用蒸馏式训练方案,使用 mixedbread-ai/mxbai-rerank-large-v2 的分数进行点式 MSE 训练,数据集为 cross-encoder/ettin-reranker-v1-data,该数据集由 lightonai/embeddings-pre-training 的子集与 lightonai/embeddings-fine-tuning 的重排序子集混合而成。它们是标准的 Sentence Transformers CrossEncoder 模型,可直接通过库中的 predict 和 rank 接口进行成对打分或排序。

查看单篇正文查看原文
12

TechCrunch AI

Google 将 Street View 接入 Genie 世界模型

·#ai-world-models

Google 将 Street View 接入 Genie 世界模型

Google DeepMind 已将 Street View 接入其通用世界模型 Project Genie,让用户能够生成真实街道和环境的交互式模拟。该功能在 Google I/O 2026 上首次亮相,并正率先向美国部分 Google AI Ultra 用户开放。

这让世界模型更接近机器人、智能体训练和仿真等实际用途,因为生成场景开始锚定真实地点。它可能帮助 Waymo 测试罕见或极端场景,也为人们提供了更具交互性的地点探索方式。

Google DeepMind 正在把 Street View 接入 Project Genie,这是一套能够生成多样化交互式环境的通用世界模型。公司在 Google I/O 2026 上公布了这项整合,并表示它的目标是让真实街道和地点的模拟变得更沉浸、更有用。DeepMind 研究科学家 Jack Parker-Holder 说,这项能力对人类用户以及智能体和机器人应用都很有价值。他举例说,系统可以模拟伦敦少见的晴天,或者展示纽约某个街区在雪天的样子。

Google 的 Street View 数据库规模非常大,过去 20 年通过摄像车和穿戴“tracker backpacks”的人员采集而来,累计超过 2800 亿张图片,覆盖 110 个国家和七大洲。Google 还提到,Genie 3 已于去年 8 月以研究预览形式发布,并在今年 1 月向美国 Google AI Ultra 订阅用户开放,已经在为 Waymo 的模拟器提供支持,用来训练自动驾驶汽车应对龙卷风或大象突然出现等极其罕见的事件。加入 Street View 之后,这种模拟可能更适合帮助 Waymo 等系统为更多城市的部署做准备,因为它既能锚定真实地点,也能把视角从车辆切换到人类或机器人。Google 目前先向美国部分 Ultra 用户开放这项功能,接下来几周还会逐步向全球 Ultra 用户推广。

Google 表示,Street View 数据库覆盖 20 年,包含超过 2800 亿张图片,分布于 110 个国家和七大洲。公司也强调 Genie 仍处于实验阶段:当前结果更像电子游戏画面而非照片级真实,而且模型还不具备物理感知能力,因此因果行为可能不正确。

查看单篇正文查看原文
13

TechCrunch AI

Google AI Studio 支持原生 Android 应用创建

·#google-ai-studio

Google AI Studio 支持原生 Android 应用创建

Google 在 2026 年 Google I/O 上宣布,网页版 AI Studio 现在可以在几分钟内创建原生 Android 应用,而不再需要数周的配置和编写代码。公司还表示,Gemini 驱动的应用发现能力将扩展到 Play 商店和网页端。

这降低了有经验开发者和非技术创作者进入 Android 开发的门槛,可能会显著扩大应用开发的人群范围。它也加剧了 AI 编程工具之间的竞争,并可能改变 Android 应用的发现与分发方式。

Google 在 2026 年 I/O 大会上宣布了对 AI 辅助 Android 开发的重大扩展。其基于网页的 Google AI Studio 现在可以在几分钟内生成原生 Android 应用,Google 认为这对资深开发者和首次创作者都很有帮助。公司表示,原本需要数周配置和编写代码的流程,现在可以被压缩成更快的浏览器工作流。Google 将这项能力视为把 AI 真正用于实际软件创作的一部分。

新的流程使用 Kotlin 和 Jetpack Compose 构建,并支持 GPS、蓝牙和 NFC 等硬件集成。Google 还表示,这个工具可用于制作个人工具、简单社交应用、硬件驱动的体验以及 AI 驱动的体验。用户可以在浏览器内置的 Android Emulator 中预览并直接交互,同时在构建过程中查看应用效果。用户也可以通过 USB 连接电脑,借助 Android Debug Bridge(adb)把应用安装到 Android 手机上。

如果开发者想继续推进项目,AI Studio 还能自动创建应用记录、打包 bundle,并上传到 Google Play Console 的内部测试轨道。这样用户可以一边迭代,一边在设备上更新应用。若要进一步走向公开发布,开发者可以下载 zip 文件,或直接导出到 GitHub,然后把项目交给 Android Studio 继续开发。Google 还表示,未来会支持向家人和朋友发布应用,并加入 Firebase 集成,包括 Firestore、Firebase Auth、Firebase App Check 等工具。

Google 还在把 AI 引入应用发现环节。新的 “Ask Play” 覆盖层允许用户在 Play 商店内通过自然对话寻找应用,而 Gemini 也会在网页和 Android 上的对话中展示应用。Google 表示这一功能将在接下来的几周内推出,到了今年晚些时候,Gemini 还会展示 45 万多个电影和电视节目,以及体育直播入口,把用户查询更直接地连接到相关内容和应用。整体来看,Google 正在描绘一个由 AI 深度参与 Android 应用创建和发现的未来。

这些应用使用 Kotlin 和 Jetpack Compose 生成,并支持 GPS、蓝牙和 NFC 等硬件功能。当前生成的应用主要用于个人使用,向家人和朋友发布以及更深入的 Firebase 集成仍在后续计划中。

查看单篇正文查看原文
14

TechCrunch AI

Google launches Antigravity 2.0 with an updated desktop app and CLI tool at IO 2026 | TechCrunch

·#ai-coding-assistants

Google launches Antigravity 2.0 with an updated desktop app and CLI tool at IO 2026 | TechCrunch

Google unveiled Antigravity 2.0 at I/O 2026, expanding its agentic coding platform with a redesigned desktop app, CLI, SDK, multi-agent workflows, background task automation, and tighter integration with Google’s developer ecosystem.

This is a significant product update from Google in the fast-moving agentic coding space, adding a desktop app, CLI, SDK, multi-agent orchestration, and workflow automation. The announcement is relevant to software engineering and AI tooling, though it is still a vendor product launch rather than a research breakthrough. No comments were provided to assess discussion quality.

At Google IO 2026 , the company unveiled a new version of its agentic coding app, Google Antigravity 2.0, with an updated desktop app, a CLI tool, and an SDK for custom workflows. The company launched its Antigravity tool last year as a response to agentic coding software such as Cursor. The company said that with the new desktop app, users can orchestrate multiple agents and execute tasks simultaneously. Plus, you can design custom subagent workflows and schedule tasks that can automatically run in the background. The new app also easily lets you integrate projects with Google AI Studio, Android, and Firebase.

查看单篇正文查看原文
15

TechCrunch AI

谷歌发布 Gemini Omni 跨模态视频生成

·#ai

谷歌发布 Gemini Omni 跨模态视频生成

谷歌在 Google I/O 开发者大会上发布了 Gemini Omni,这是一个新的多模态模型家族,可以结合图像、音频、视频和文本来生成和编辑媒体内容。首个版本 Gemini Omni Flash 现已开始向 Gemini 应用、YouTube Shorts 和 Flow 创意工作室推出。

这让谷歌更接近其长期目标:用一个模型同时理解并生成多种媒体类型,这可能重塑面向消费者和创作者的 AI 工具。它也通过把 Gemini 的推理能力与媒体渲染模型结合起来,增强了谷歌在生成式视频领域的竞争力。

谷歌最初发布 Gemini 时,就把它定位为一个原生多模态模型,训练目标涵盖文本、图像、音频和视频,希望它能跨不同格式生成内容。到了 Google I/O,谷歌表示自己正朝这个方向迈出具体一步,推出 Gemini Omni 这一新的多模态模型家族。Sundar Pichai 把它概括为可以“从任何输入创造任何东西”。Omni 首先聚焦视频生成,用户可以把图像、音频、视频和文本一起输入模型,由模型跨这些输入进行推理,而不是简单把素材拼接起来。谷歌称,这样生成的视频会更一致,也更像理解了物理、科学、历史和文化等现实世界知识。它还支持用纯文本命令编辑照片,体验类似谷歌的 Nano Banana。谷歌其实已经有了专门的视频模型 Veo,可以把文本和图像转成视频,甚至生成和定制头像,但 DeepMind 产品管理负责人 Nicole Brichtova 表示,Omni 不是一次简单的 Veo 更新。

她把这次发布描述为“把 Gemini 的智能与媒体模型的渲染能力结合起来”的下一步。DeepMind 首席技术官 Koray Kavukcuoglu 还举了一个演示:当 Omni 收到“蛋白质折叠的黏土动画讲解”这样的提示时,它很快生成了一段定格动画风格的视频,并配上关于氨基酸链和蛋白质结构的旁白。谷歌还表示,Omni 的长期目标不止是视频,还包括用音频生成图像、用视频生成音频等。首个模型 Gemini Omni Flash 今天开始向 Gemini 应用、YouTube Shorts 和 Flow 推出,当前可生成 10 秒视频。Brichtova 说,这个时长限制不是模型本身做不到更长,而是为了先让更多人用起来,同时估计大多数用户暂时也不需要更长的视频。谷歌还把它定位为偏消费者工具,给出的例子包括把自己做成“获奖”或“登月”的视频,或者移除假期视频里的路人。用户若要创建数字头像视频,需要经过专门的入门流程,录制自己并念出一串数字,以降低深度伪造风险;所有 Omni 生成的视频也都会带有 SynthID 数字水印,方便验证来源。

Omni 先从视频生成开始,但谷歌表示它会跨输入进行推理,而不是简单拼接素材,目标是生成体现物理、文化、历史和科学理解的输出。谷歌还计划支持数字头像视频创建,并通过专门的入门流程来帮助防止深度伪造;所有 Omni 生成的视频都会带有 SynthID 数字水印以便验证。

查看单篇正文查看原文
16

TechCrunch AI

Andrej Karpathy 加入 Anthropic 预训练团队

·#ai

Andrej Karpathy 加入 Anthropic 预训练团队

Andrej Karpathy 已加入 Anthropic,并在本周开始在团队负责人 Nick Joseph 领导下从事预训练工作。他在 X 上表示,很高兴回到研发一线,并认为未来几年在 LLM 前沿会尤为关键。

Karpathy 是少数在 OpenAI、Tesla 以及如今 Anthropic 之间都具有代表性的研究者之一,因此这次任命强烈表明前沿模型公司正在寻找新的竞争优势。Anthropic 明确押注 AI 辅助研究能够提升预训练效率和模型能力,而不仅仅依赖更多算力。

Andrej Karpathy 是一位知名 AI 研究者,曾联合创办 OpenAI,之后又在 Tesla 负责 AI 工作,如今他已经加入 Anthropic。Karpathy 在 X 上宣布了这一变动,并表示自己很期待回到研究岗位,因为未来几年处于 LLM 前沿的阶段会非常关键。Anthropic 说他本周已经开始上班,并在团队负责人 Nick Joseph 的带领下参与预训练相关工作。公司将预训练描述为给 Claude 提供核心知识和能力的大规模训练过程,同时它也是构建前沿模型时最昂贵、最吃算力的阶段之一。Anthropic 发言人还表示,Karpathy 将组建一个团队,专门研究如何利用 Claude 来加速预训练研究。

这说明 Anthropic 希望把模型本身用于改进模型研发,从而在与 OpenAI 和 Google 的竞争中保持优势。Karpathy 过去的经历包括深度学习、计算机视觉、Tesla 的 Autopilot 和 FSD 项目,以及后来短暂回到 OpenAI。2024 年离开 OpenAI 后,他创办了 Eureka Labs,专注于把 AI 助手应用到教育领域;他也表示自己仍然非常热爱教育,未来会重新投入这项工作。TechCrunch 表示已就此联系 Karpathy 寻求评论。

Anthropic 表示,Karpathy 将组建一个团队,专注于使用 Claude 来加速预训练研究,这说明公司正在把自己的模型用于改进模型训练本身。预训练是决定 Claude 核心知识和能力的高算力阶段,因此这在技术栈中具有很强的战略意义。

查看单篇正文查看原文
17

The Decoder

Karpathy 加入 Anthropic 投身前沿 LLM 研究

·#ai-research

Karpathy 加入 Anthropic 投身前沿 LLM 研究

Andrej Karpathy 表示他将加入 Anthropic,具体是在其预训练团队,以回到前沿大语言模型研究。他称未来几年处在 LLM 前沿的阶段将“尤其具有塑造性”。

Karpathy 是 AI 领域最知名的人物之一,曾在 OpenAI 和 Tesla 担任重要角色,因此他的加入对 Anthropic 来说是一次显著的人才收获。这也说明顶级实验室正在争夺能够影响下一代基础模型和训练方法的研究人员。

知名 AI 研究者 Andrej Karpathy 将加入 Anthropic,此前他曾在 OpenAI 和 Tesla 工作。Karpathy 在 X 上表示,他很高兴重新回到研究与开发工作,并认为未来几年处在大语言模型前沿的阶段“尤其具有塑造性”。文章称,他将加入 Anthropic 的预训练团队,该团队负责大型 AI 模型训练的第一阶段。这个阶段的目标,是先构建尽可能强的基础模型,之后再通过强化学习等方法针对推理、编程或数学等任务进行微调。

文章还援引 Axios 称,Karpathy 将组建自己的预训练团队,并利用 Claude 来加速预训练研究。报道认为,这对 OpenAI 来说是一次明显的人才流失,因为 Karpathy 曾是其早期核心团队成员,之后又回到 OpenAI,直到 2024 年最终离开。他最近主要在通过创业公司 Eureka Labs 关注 AI 教育,并表示未来合适的时候仍会重新投入这项工作。文章最后强调,他选择 Anthropic 也反映出顶级 AI 实验室之间争夺前沿研究人才的竞争非常激烈。

Anthropic 的预训练团队负责大型 AI 模型的初始训练阶段,目标是在后续微调之前先构建尽可能强的基础模型。文章称 Karpathy 将组建自己的预训练团队,并利用 Claude 加速预训练研究,但除此之外没有提供更多技术细节。

查看单篇正文查看原文
18

The Decoder

Google 发布 Gemini 3.5 Flash、Omni 和常驻 Spark

·#google-i-o

Google 发布 Gemini 3.5 Flash、Omni 和常驻 Spark

在 I/O 大会上,Google 发布了 Gemini 3.5 Flash,这是一款更快、成本更低的新模型,同时推出 Gemini Omni,用于视频、图像和文本生成的多模态系统。公司还推出了 Gemini Spark,这是一款可持续在云端运行的个人智能体,并对 Gemini 应用进行了大幅视觉重设计。

这些发布表明,Google 正在把 AI 从单纯聊天工具推进到更快的模型、多模态创作和全天候运行的智能体工作流。它可能会重塑开发者构建产品的方式,以及用户与 Google 消费级和云端 AI 体系交互的方式。

Google 在 I/O 开发者大会上发布了一系列新的 AI 产品和平台更新。最受关注的是 Gemini 3.5 Flash,Sundar Pichai 表示,它在几乎所有基准测试上都超过了大约四个月前发布的 Gemini 3.1 Pro,其中包括面向经济任务的 GDP Val 基准。Google 还声称,根据 Artificial Analysis 的分析,这款模型在智能与速度的表现上处于前沿模型中的领先位置,速度大约是其他前沿模型的四倍;而在自家的 Antigravity 智能体平台上运行的优化版本,速度甚至可以快十二倍。Google 还表示,这一系列模型的成本大约只有同类模型的三分之一到一半。Pichai 进一步称,如果企业把 80% 的工作负载迁移到 Gemini 3.5 Flash 和 Pro 的组合上,每年可节省超过 10 亿美元,而 Gemini 3.5 Pro 预计将在下个月推出。

首席 AI 架构师 Koray Kavukcuoglu 强调,3.5 系列是为智能体式工作而设计的,支持持续数小时的自主会话,以及复杂的编程流水线。Google 甚至称,他们内部测试时让模型从零构建出一个可运行的操作系统。公司还推出了 Gemini Omni,并将其描述为 Veo 的多模态继任者。Omni 建立在 Gemini 架构之上,从底层就是按照多模态输入和输出进行训练,而不是像纯文本转视频系统那样工作。

Omni 的首个版本先从视频开始,图像和文本支持会在后续加入。Google 表示,系统可以把自己生成的结果再次作为输入,从而实现迭代式编辑,例如上传视频、替换角色或改变风格。对于 Omni 是否取代 Veo 的问题,Kavukcuoglu 回应说,Omni 是 Veo 的泛化版本,也是 Google 走向真正多模态的重要一步。首个更快的版本 Omni Flash 将于周二向 Google AI+、Pro 和 Ultra 订阅用户开放,使用场景包括 Gemini 应用、Flow 和 YouTube Shorts;同时,API 版本和更强大的 Omni Pro 也在计划中。Google 表示,所有生成内容都会带有不可见的 SynthID 水印。

Google 还发布了 Gemini Spark,这是一款面向终端用户的个人智能体,运行在 Google Cloud 中的专用虚拟机上。负责 Gemini 应用和 AI Studio 的 Josh Woodward 表示,Spark 可 24/7 保持在线,即使用户设备关机也会在后台继续工作,同时在编码任务中使用 Gemini 3.5 和完整的 Antigravity 流水线。该功能上线时就会与 Gmail、Docs 和其他 Workspace 产品集成,未来几周还会加入面向第三方服务的 MCP 连接。Chrome 集成会在之后推出,而 Android 端还会新增一个名为 Android Halo 的界面,在屏幕顶部直接显示智能体正在执行的操作。Google 说,Halo 不仅支持 Spark,也会支持其他兼容的智能体;运行 Gemini Nano 的设备还会获得额外功能。

除了模型和智能体更新之外,Google 还对 Gemini 应用进行了大幅视觉重设计。整体来看,这次发布把消费级应用、云基础设施和开发者工具更紧密地整合到一个更偏智能体驱动的 AI 体系中。

Google 表示,Gemini 3.5 Flash 在几乎所有基准测试上都优于较早的 Gemini 3.1 Pro,并且在 Antigravity 的优化部署中速度更快。Gemini Omni 先从视频开始,之后会支持图像和文本,生成结果还能作为下一轮输入进行迭代编辑;所有生成内容都带有 SynthID 水印。

查看单篇正文查看原文
19

The Decoder

Agora-1将《黄金眼》变成多人AI世界模型

·#ai-world-models

Agora-1将《黄金眼》变成多人AI世界模型

Odyssey 发布了 Agora-1,这是一种世界模型,能够同时为最多四名玩家模拟一个类似《黄金眼》的共享环境。公司还推出了 Starchild-1,这是一种可响应文本输入的交互式音视频世界模型。

Agora-1 的重要性在于,它把世界模型从单用户演示推进到多智能体场景,让多个参与者共享同一个模拟状态。这可能让这种方法更适用于 AI 代理训练、协作机器人,以及其他需要多个主体在同一环境中保持一致推理的系统。

AI 实验室 Odyssey 发布了 Agora-1,这是一种世界模型,能够把任天堂 N64 经典游戏《黄金眼》变成最多四名玩家可同时参与的共享模拟环境。该系统被描述为首批多智能体世界模拟之一,把过去大多只支持单个活动用户的世界模型推进到了多人场景。在演示环境中,所有玩家都在同一个 AI 生成的世界里进行实时交互,玩法类似死亡竞赛。Odyssey 认为,这个模型更像一个“学习出来的游戏引擎”,而不是一段固定的视频。与 OpenAI 的 Sora 或 Google 的 Veo 3 等视频生成器不同,Agora-1 不会一次性吐出一段静态片段,而是持续更新游戏状态,并为每位玩家实时渲染不同视角。公司将系统拆分为两部分:一个模拟模型学习游戏内部状态如何随玩家动作变化,另一个基于扩散的渲染模型把该状态转换成画面。

Odyssey 表示,这种显式状态管理既能保留原作机制,也能在不破坏游戏逻辑的情况下生成新关卡。公司还指出,较早的多智能体方案如 Multiverse 或 Solaris 在玩家彼此看不见时容易出现问题,而 Agora-1 的目标是让所有人始终锚定在同一个共享世界中。除了 Agora-1,Odyssey 还推出了 Starchild-1,这是一种交互式音视频世界模型,能够在响应持续文本输入的同时生成同步画面和声音。Starchild-1 可在现代硬件上以最高 24 帧每秒运行,但它与 Agora-1 不同,更偏向单用户场景。Odyssey 目前还没有公开发布 Starchild-1 的可试玩演示,只提供了视频样例和技术论文。由 CEO Oliver Cameron 和 CTO Jeff Hawke 领导的团队表示,这两项技术未来可能用于 AI 代理训练和协作机器人。

Odyssey 表示 Agora-1 将系统拆分为模拟和渲染两部分:一个模型维护共享的游戏状态,另一个基于扩散的模型实时渲染每个玩家的视角。公司称这种设计既能保留原游戏机制,也可以生成新关卡,并将 Agora-1 定位为早期研究预览,而不是成熟的公开产品。

查看单篇正文查看原文
20

The Decoder

Mythos Preview 找到前沿模型遗漏的漏洞利用链

·#ai-security

Mythos Preview 找到前沿模型遗漏的漏洞利用链

Cloudflare 表示,Anthropic 的 Mythos Preview 在对超过 50 个 Cloudflare 代码仓库的安全测试中,表现优于更早的前沿模型。它能够把多个小漏洞串联成可运行的概念验证漏洞利用,并通过自己编写、编译和运行代码来验证其真实性。

这一结果表明,AI 模型正在从发现单个漏洞,进一步走向构建更接近真实攻击者工作流的漏洞利用链。它可能提升防御方的 AI 辅助漏洞研究效率,但也意味着同样的能力可能被用于攻击。

Cloudflare 表示,它将 Anthropic 的安全导向模型 Mythos Preview 纳入 Project Glasswing,在超过 50 个自有代码仓库中进行了测试。测试目标不是只看模型能否识别单个漏洞,而是看它能否把多个漏洞串联起来,形成完整的利用链。Cloudflare 首席安全官 Grant Bourzikas 说,更早的前沿模型虽然也能发现类似的单个漏洞,有时还会给出很好的分析,但它们往往无法把这些漏洞拼成一个真正可运行的漏洞利用,因此漏洞是否真正可被利用仍然不清楚。相比之下,Mythos Preview 更擅长把小的弱点组合成概念验证攻击,并且能够自己编写、编译和运行这些 PoC 代码。

Cloudflare 还表示,这个模型产生的推测性结果更少,复现步骤更清晰,因此在决定某个问题是需要修复还是可以忽略之前,所需的人工作业也更少。不过,Cloudflare 强调这并不是单个代理就能完成的工作,而是一个多阶段系统,最多同时运行 50 个代理,并加入对抗式复核,让第二个代理尝试推翻每一项发现。Cloudflare 也提醒,这种能力对防御者有价值,但对攻击者同样可能有用。

Cloudflare 表示,更早的前沿模型通常也能找到相同的漏洞,但它们很难把这些漏洞拼接成完整的利用路径,往往还需要更多人工跟进。Mythos Preview 产生的推测性结论更少、复现步骤更清晰,并且更少依赖人工即可做出“修复或忽略”的判断,不过 Cloudflare 也强调,它仍然使用了最多 50 个并行代理和对抗式复核的多阶段框架。

查看单篇正文查看原文
21

The Verge AI

Google I/O 2026 最重大的 AI 与眼镜发布

·#google-i-o

Google I/O 2026 最重大的 AI 与眼镜发布

Google 在 I/O 2026 主旨演讲中发布了全新的 Gemini 3.5 模型家族、重新设计的 Gemini 应用,以及覆盖 Search、Gmail、Android 应用构建和智能眼镜的一系列 AI 更新。会议还展示了 Project Aura 的新进展,以及来自 Warby Parker 和 Gentle Monster 的新款 Android XR 眼镜。

这些发布表明,Google 正在把 AI 更深入地嵌入核心消费产品,同时通过智能眼镜扩展到环境计算领域。对于开发者和普通用户来说,这些更新可能会改变人们搜索、写作、开发应用以及在不同设备上与 AI 交互的方式。

Google 在 I/O 2026 主旨演讲中发布了全新的 Gemini 3.5 模型家族、重新设计的 Gemini 应用,以及覆盖 Search、Gmail、Android 应用构建和智能眼镜的一系列 AI 更新。会议还展示了 Project Aura 的新进展,以及来自 Warby Parker 和 Gentle Monster 的新款 Android XR 眼镜。 这些发布表明,Google 正在把 AI 更深入地嵌入核心消费产品,同时通过智能眼镜扩展到环境计算领域。

对于开发者和普通用户来说,这些更新可能会改变人们搜索、写作、开发应用以及在不同设备上与 AI 交互的方式。 Gemini 3.5 Flash 搭配了名为“neural expressive”的新版 Gemini 应用界面,并将从 5 月 19 日起在网页端、Android 和 iOS 上陆续推出。Google 还表示,Gemini Omni Flash 可以基于文字、照片、视频和音频等混合输入生成视频片段,而 Spark 会在 Google Cloud 虚拟机上 24/7 运行,并可连接 Workspace 和部分第三方应用。

Gemini 3.5 Flash 搭配了名为“neural expressive”的新版 Gemini 应用界面,并将从 5 月 19 日起在网页端、Android 和 iOS 上陆续推出。Google 还表示,Gemini Omni Flash 可以基于文字、照片、视频和音频等混合输入生成视频片段,而 Spark 会在 Google Cloud 虚拟机上 24/7 运行,并可连接 Workspace 和部分第三方应用。

查看单篇正文查看原文
22

The Verge AI

谷歌推出 Gemini Spark AI 代理

·#ai-agents

谷歌推出 Gemini Spark AI 代理

谷歌在 I/O 2026 上发布了 Gemini Spark,这是一款由 Gemini 3.5 Flash 驱动的常驻 AI 代理。它可以在后台持续运行,连接 Google Workspace,并通过模型上下文协议(MCP)扩展到第三方应用。

这标志着谷歌正式进入快速增长的 AI 代理市场,这类软件不再只是回答问题,而是可以跨应用替用户执行任务。如果效果足够好,Spark 可能改变用户在谷歌生态及其外部的邮件、文档、购物和日程管理方式。

谷歌正在推出 Gemini Spark,作为今年引发行业关注的 AI 代理平台的一种自家版本。该产品在 Google I/O 2026 上公布,主打“常驻”能力,即使用户合上笔记本电脑或关闭手机,它也能在后台持续运行。Gemini Spark 由新发布的 Gemini 3.5 Flash 驱动,可以帮用户撰写邮件、生成会持续更新的学习指南,还能检查信用卡账单里是否存在隐藏的订阅扣费。谷歌表示,这个代理运行在 Google Cloud 的虚拟机上,因此能够 24 小时不停工作。它首先会接入 Gmail、Docs、Sheets 和 Slides 等 Workspace 应用。

谷歌还计划通过模型上下文协议(MCP)扩展到第三方应用,MCP 是一种让 AI 模型连接外部系统或数据的开放标准,首批包括 Canva、OpenTable 和 Instacart。到今年夏天,Spark 还将能通过 macOS 版 Gemini 应用访问本地文件,之后也会连接到 Chrome,并在一个名为 Android Halo 的新界面区域中显示实时更新。谷歌强调 Spark 会“在你的指挥下”运行,在执行付款或发送邮件等高风险操作前会请求用户许可。Gemini Spark 本周先向受信任测试者开放,下一周将在美国面向 Google AI Ultra 订阅用户进入 Beta 阶段。与此同时,谷歌还宣布 Spark 会使用其 AI 编程工具 Antigravity,而 Antigravity 也将迎来大更新,包括新的桌面应用、命令行界面和软件开发工具包,方便开发者管理和构建 AI 代理。

Spark 通过 Google Cloud 上的虚拟机 24 小时运行,可以写邮件、生成持续更新的学习指南,还能监测信用卡账单中的隐藏订阅费用。谷歌表示它会在用户控制之下运行,并会在支付或发送邮件等高风险操作前请求许可,首先面向受信任测试者开放,随后于下周向美国 Google AI Ultra 订阅用户提供 Beta 版。

查看单篇正文查看原文
23

ZDNET AI

微软推出 Azure Linux 4.0

·#linux

微软推出 Azure Linux 4.0

微软宣布推出 Azure Linux 4.0,这是其首个获得完整支持、可通用部署的服务器 Linux 发行版。与此同时,公司还将 Linux 产品线拆分为面向虚拟机的 Azure Linux 和面向加固容器主机的 Azure Container Linux。

这标志着微软在 Azure 上对 Linux 的依赖已经非常深入,不只是支持 Linux,而是开始直接交付 Linux。它对云运维人员和 Kubernetes 用户很重要,因为他们现在有了一个由微软支持、专为 Azure 工作负载设计的 Linux 选项。

微软在 Open Source Summit North America 期间意外宣布推出 Azure Linux 4.0,而这条消息原本计划在两周后的 Microsoft TechCon 上发布。微软 Azure Cloud Native and Management Platform 以及 Open Source 的企业副总裁 Brendan Burns 表示,在过去十年里,Linux 已经成为运行在 Azure 上的主流操作系统。这个宣布意味着微软现在开始提供一款由自己支持、可用于 Azure 的 Linux 发行版。现场反应之所以强烈,是因为微软以前虽然发布过基于 Linux 的产品,但从未推出过通用型 Linux 发行版。微软此前的 Linux 相关项目包括 Azure Sphere,以及后来更名为 Azure Linux 的 CBL-Mariner。

微软开放源代码团队的首席项目经理 Lachlan Everson 解释说,Azure Linux 4.0 是面向所有 Azure 客户的通用虚拟机镜像,而 Azure Linux 3.0 之前只面向 AKS 客户,主要作为容器主机使用。他还提到,微软正在把 Flatcar Container Linux 产品化为 Azure Container Linux,用作加固且不可变的容器主机。微软表示,Azure Linux 4.0 基于 Fedora Linux,并已作为开源项目发布到 GitHub。这个消息也说明,微软与 Linux 的关系已经从过去 Steve Ballmer 时代的对立,演变为如今微软自己都在交付 Linux 发行版。

Azure Linux 4.0 被定位为面向所有 Azure 客户的通用虚拟机镜像,而此前的 Azure Linux 3.0 仅限于 AKS 中作为容器主机使用。微软表示其底层基于 Fedora Linux,并已在 GitHub 上以开源形式发布;而面向容器的路线则被单独产品化为 Azure Container Linux(ACL)。

查看单篇正文查看原文
24

Ars Technica AI

两个AI科研助手推动药物再定位

·#ai-for-science

两个AI科研助手推动药物再定位

《Nature》发表了两篇论文,介绍两套旨在帮助科学家提出并检验假设的AI系统。Google 的 Co-Scientist 采用“科学家在回路中”的方式,而 FutureHouse 的系统则被训练用于评估来自特定实验类型的生物数据。

这些系统展示了AI在科研中的一个现实角色:不是取代研究人员,而是加速对海量生物文献和实验数据的筛选与解读。这可能让药物再定位和假设探索对生物学家与药物发现团队来说更快、更可扩展。

周二,《Nature》发表了两篇论文,介绍两套旨在帮助科学家提出并检验假设的AI系统。其一是 Google 的 Co-Scientist,官方将其描述为“scientist in the loop”工具,也就是研究人员仍然需要用自己的判断来持续引导系统。另一套来自非营利组织 FutureHouse,它被训练用于评估某些特定类型实验产生的生物数据。尽管 Google 表示其系统未来也可能用于物理学,但这两篇论文都主要展示了生物学场景,而且聚焦的是相对直接的问题,例如某种药物是否可能对特定靶点起作用。

文章明确强调,这些系统并不是要取代科学家或科学方法,而是用来处理现代科研产生的海量信息。两套系统都被描述为agentic,也就是会在后台调用其他工具来完成工作,这使它们不同于更简单的聊天式模型。它们试图解决的核心问题是信息过载:期刊和论文数量随着在线发表变得越来越多,研究人员即使在自己领域内也很难及时跟进,更不用说跨领域的相关发现。文章举例说,眼发育中使用的某种信号系统,可能也同样参与肾脏生物学,如果没有计算工具辅助,就很容易错过这种跨领域联系。

这两套系统都被描述为agentic,也就是通过在后台调用不同工具来工作,而不是作为单一聊天模型直接输出答案。文章强调,它们当前处理的是相对直接的生物学问题,例如某种药物是否可能作用于特定靶点,并不声称能端到端自动化科学研究。

查看单篇正文查看原文
25

Cloudflare AI

Claude 代理接入 Cloudflare 沙盒

·#ai-agents

Claude 代理接入 Cloudflare 沙盒

Cloudflare 和 Anthropic 宣布了一项集成,使 Claude Managed Agents 可以运行在 Cloudflare Sandboxes 中。开发者可以把 Claude 的代理循环保留在 Anthropic 平台上,同时用 Cloudflare 负责代码执行、工具调用、连接能力和可观测性。

这让团队对代理工作负载的运行位置拥有更多控制权,对安全、合规和性能敏感的部署都很重要。它也强化了 Cloudflare 作为智能体应用基础设施层的定位,因为它补齐了沙盒、私有连接和更好的运维可视化能力。

Cloudflare 和 Anthropic 推出了一项将 Claude Managed Agents 与 Cloudflare Sandboxes 结合的集成。其目标是为代理执行提供更安全、可观测、可控制的运行环境。Cloudflare 表示,这一集成是其面向大规模运行智能体的开发者平台战略的一部分,相关能力还包括 Sandboxes、Agents SDK、Browser Run 和 Dynamic Workers。Claude Managed Agents 原本已经可以让开发者构建能够读取文件、运行命令、浏览网页和执行代码的代理,但过去通常需要完全运行在 Anthropic 托管的基础设施上。

借助这次集成,代理循环可以继续运行在 Anthropic 平台上,而执行层则放在 Cloudflare 中,Anthropic 将这种模式称为把“脑”和“手”解耦。默认部署模板旨在让团队在几分钟内开始使用,并提供通过可定制代理实现的增强安全性、详细的沙盒指标和日志、对内部服务的私有连接,以及浏览器控制和自定义工具支持。Cloudflare 还强调,状态会在会话休眠之间自动保留,而且开发者可以根据规模和成本需求在 microVM 与轻量 isolate 之间选择。两家公司把这项集成定位为一种更灵活地运行基于 Claude 的代理,同时不牺牲可观测性和控制能力的实用方案。

这项集成支持完整有状态的 Linux microVM 沙盒,也支持启动更快、成本更低的轻量 isolate。它还提供基于代理的流量控制、私有服务访问、沙盒指标和日志、SSH 访问、浏览器会话录制、代理专属邮箱以及自定义工具等能力。

查看单篇正文查看原文
26

Financial Times AI

·#ai-industry

Cerebras融资预示科技IPO热潮

《金融时报》报道称,Cerebras完成了64亿美元融资,这被华尔街解读为大型科技公司上市环境正在改善的信号。报道还提到,投资者正关注SpaceX、OpenAI和Anthropic未来可能的IPO。

一笔成功的大额融资可能在公开市场谨慎情绪之后,帮助重新打开高估值科技公司的IPO窗口。如果SpaceX、OpenAI和Anthropic等公司走向上市,可能会重塑AI、半导体以及风险投资科技板块的市场情绪。

《金融时报》报道称,在Cerebras完成64亿美元融资后,华尔街正在为可能到来的科技公司IPO热潮做准备。市场将这笔融资解读为一个信号:投资者再次愿意以较高估值支持大型私人科技公司。这个变化之所以重要,是因为过去几年科技公司在公开市场上市的环境并不稳定。报道指出,市场参与者现在已经开始关注更大规模的潜在上市交易。

被提到的公司包括SpaceX、OpenAI和Anthropic。整体来看,Cerebras的融资可能成为私人科技资产需求回暖的早期指标。也就是说,这笔交易的意义不仅在于Cerebras本身,更在于它暗示了下一波上市潮的可能性。

报道把芯片设计公司Cerebras视为近期信号而非唯一主角:其64亿美元融资表明,投资者对大型、具有雄心的科技公司仍有需求。这则新闻重点在于市场定位和IPO准备度,而不是产品发布或技术突破。

查看单篇正文查看原文
27

Financial Times AI

·#ai-infrastructure

谷歌支持Blackstone的AI云扩张

谷歌将向一个由Blackstone支持的AI云项目投入50亿美元。该投资旨在帮助该项目在明年上线500MW的数据中心容量。

这意味着AI基础设施正在进一步扩张,而当前对算力、电力和数据中心容量的需求增长很快。它也表明,主要云和半导体相关参与者仍在大举投入支撑AI工作负载所需的实体基础设施。

据报道,谷歌将向一个由Blackstone支持的AI云项目投资50亿美元。该资金将用于支持大规模数据中心基础设施建设。该项目预计在明年新增500MW容量,这表明可用于AI服务的算力和电力供应将显著提升。此举反映出大型科技公司正在争夺支撑AI训练和推理所需的基础设施。

就实际效果而言,这类容量扩张可以支持更大的工作负载、更多客户或新的AI产品。报道将这笔投资视为谷歌芯片与云业务推进的一部分,而不是面向消费者的产品发布。除投资金额和计划新增容量外,所给内容没有提供更多技术细节。

据报道,该计划的核心是在明年新增500MW的数据中心容量,这在云行业标准下属于大规模扩建。现有信息没有披露芯片架构、选址或除“明年”以外的更具体部署时间表等技术细节。

查看单篇正文查看原文
28

Google AI Blog

Google 用 Gemini 3.5 Flash 升级 Search

·#ai-search

Google 用 Gemini 3.5 Flash 升级 Search

Google 表示,已将 Gemini 3.5 Flash 作为 AI Mode 中面向全球用户的新默认模型来升级 Search。公司还推出了重新设计的、由 AI 驱动的 Search 搜索框,以及用于信息监控和预订任务的新代理功能。

这标志着 Google Search 正在进一步转向 AI 优先,而不只是一个带生成式回答的搜索框。此类变化可能会影响数十亿用户搜索、追问以及委托任务的方式,例如监控房源或完成预订。

Google 将这次发布描述为 AI Search 的新阶段,并表示 Search 的长期目标一直是帮助用户提出任何问题,从简单事实到难以准确表达的复杂或高度具体的问题。公司称,Search 内部的 AI 采用速度非常快,AI Mode 在上线一年后月活已超过 10 亿,查询量自发布以来每个季度都翻倍增长。Google 还表示,上个季度 Search 查询量创下历史新高,并将其视为 AI 功能在提升整体搜索使用量,而不是取代搜索本身的证据。Google 在 I/O 上表示,它正在把“搜索引擎的最佳能力”和“AI 的最佳能力”结合起来。从今天开始,Search 将在全球范围内把 Gemini 3.5 Flash 作为 AI Mode 的默认模型进行升级。

Google 表示,这款最新的 Flash 模型可为 agents 和 coding 提供持续的前沿性能。公司还发布了重新设计的 Search 搜索框,它可以动态展开、给出超越自动补全的提问建议,并支持把文本、图片、文件、视频或 Chrome 标签页作为输入。除此之外,用户还可以从 AI Overview 直接进入与 AI Mode 的对话式追问,并在保留上下文的同时看到更相关的链接和支持文章。Google 还把下一阶段称为 Search agents 时代,先从信息代理开始,这些代理可以在后台持续监控网络和 Google 的实时数据,并向用户发送综合更新。此类代理将于今年夏天首先向 Google AI Pro 和 Ultra 订阅用户推出,Google 也在扩展面向本地体验和服务的代理式预订能力,包括在某些类别中代表用户致电商家。

Google 表示,AI Mode 的月活用户已超过 10 亿,自发布以来查询量每个季度都翻倍增长,而上个季度 Search 的查询量也创下历史新高。新的智能 Search 搜索框今天开始在 AI Mode 可用的国家和语言地区推送,而信息代理将于今年夏天首先向 Google AI Pro 和 Ultra 订阅用户推出。

查看单篇正文查看原文
29

Google AI Blog

Google 更新 AI 订阅,推出新 Ultra 档位

·#google-ai

Google 更新 AI 订阅,推出新 Ultra 档位

Google 在 I/O 2026 上公布了新的 AI 订阅更新,其中包括每月 100 美元的 AI Ultra 新方案,以及将最高级 Ultra 方案的价格从 250 美元降到 200 美元。此次更新还为订阅用户加入了 Gemini 3.5 Flash,并提供 Google Antigravity 的优先访问权。

这为开发者、技术负责人和高级创作者扩展了 Google 的高端 AI 服务,并提供更高的使用额度和更强的模型能力。它也表明 Google 正在推动 AI 代理和 AI 辅助开发成为其订阅体系中的核心内容。

Google 在 I/O 2026 上发布了其 AI 订阅体系的一次重要更新。公司推出了每月 100 美元的 AI Ultra 新方案,面向开发者、技术负责人、知识工作者和高级创作者。该档位在 Gemini 应用和 Google Antigravity 中的使用额度是 Pro 方案的 5 倍,并集成了 Gemini 3.5 Flash,用于更快的测试、调试和迭代。新方案还提供 Google Antigravity 的优先访问权、20TB 云存储,以及个人版 YouTube Premium 订阅。与此同时,Google 将最高级 AI Ultra 方案的价格从 250 美元下调到 200 美元,但保留原有能力不变,包括比 Pro 高 20 倍的使用额度。

Google 还强调,AI Ultra 用户可以使用 Gemini Spark,这是一款 24/7 的 AI 代理,在美国先向受信测试者开放,随后会向 Ultra 订阅用户进行 Beta 推出。另一个实验性项目 Project Genie 也在扩展到符合条件、年满 18 岁的 200 美元 Ultra 用户。Google 还提到,订阅用户可使用 Gemini Omni 进行多模态创作和编辑,以及使用 Gemini 3.5 Flash 处理代理和编程场景。整体来看,这次更新把模型访问、开发工具、存储和媒体权益打包进更明确的分层订阅中。

新的 100 美元 Ultra 方案在 Gemini 和 Google Antigravity 中的使用额度是 Pro 的 5 倍,还包含 20TB 云存储和个人版 YouTube Premium。Google 还表示,200 美元的 Ultra 档位保持原有能力不变,包括比 Pro 高 20 倍的使用额度。

查看单篇正文查看原文
30

OpenAI News

·#ai-safety

OpenAI 推进 AI 内容溯源

OpenAI 宣布推出新的内容溯源举措,核心包括 Content Credentials、SynthID 以及一款用于 AI 生成媒体的验证工具。其目标是帮助人们识别媒体来源,并判断其是否值得信任。

随着合成图像、音频和视频变得越来越容易生成,溯源系统正成为 AI 安全和媒体真实性的重要基础设施。这对平台、出版商以及需要实用方法来区分 AI 生成内容和真实素材的用户都很重要。

OpenAI 宣布推进一项新的内容溯源计划,重点面向 AI 生成媒体。该计划围绕 Content Credentials、SynthID 和一款验证工具展开,旨在帮助人们识别并信任由 AI 系统创建的媒体内容。OpenAI 将这项工作定位为构建更安全、更透明的 AI 生态系统的一部分。与强调生成能力不同,这次公告更关注可追踪性和可信度。

其核心思路是让观看者和下游平台能够获得更多关于媒体来源的信息,并了解内容是否由 AI 生成或修改。随着合成媒体越来越普遍,也越来越难与人类创作内容区分,这类溯源层的重要性正在上升。该公告把溯源视为整个生态中的一项实用安全措施。所提供材料中没有进一步的技术细节、发布范围或社区反馈。

这项公告并非只依赖单一标准,而是结合了多种溯源方法,说明互操作性是重点。配套的验证工具意味着可以检查内容是否携带受支持的溯源信号,但现有材料没有说明具体实现限制或覆盖范围。

查看单篇正文查看原文
31

Simon Willison

五分钟看懂 LLM 六个月变化

·#llms

五分钟看懂 LLM 六个月变化

Simon Willison 发布了他在 PyCon US 2026 闪电演讲中的注释幻灯片,用五分钟回顾了过去六个月的 LLM 发展。演讲强调了 2025 年 11 月这一转折点,并记录了 Anthropic、OpenAI 和 Google 之间“最佳”模型五次易手的变化。

对于从业者来说,这是一份简洁但信息密度很高的模型格局速览,尤其适用于面向编程的场景。它也说明了模型领先地位变化有多快,这会直接影响工具选型、基准测试和产品规划。

Simon Willison 发布了他在 PyCon US 2026 上做的五分钟闪电演讲的注释版幻灯片。这个演讲试图用极短的篇幅总结过去六个月里 LLM 的主要进展。Willison 将这段时间称为一个很值得回顾的窗口,因为它覆盖了他所谓的 2025 年 11 月“转折点”。他表示,11 月对 LLM 尤其是编程能力来说是一个关键月份。

在这段时间里,关于哪个模型“最好”的非正式判断,在 Anthropic、OpenAI 和 Google 之间来回变化了五次。为了展示不同模型之间的差异,他使用了自己长期沿用的“生成一只骑自行车的鹈鹕的 SVG”测试。Willison 认为这个测试有价值,正是因为它很怪、很难被针对性优化,而且任何实验室都没有动力专门为这种任务训练模型。这组幻灯片以注释图片形式呈现,并使用了他最新版本的注释演示工具制作。

Willison 用“生成一只骑自行车的鹈鹕的 SVG”测试来比较模型表现,并强调这是一个故意荒诞的任务,厂商不会专门针对它进行训练优化。他指出,11 月初普遍公认的“最佳”模型是 Claude Sonnet 4.5,随后依次被 GPT-5.1、Gemini 3、GPT-5.1 Codex Max 以及 Claude Opus 4.5 超越。

查看单篇正文查看原文
32

TechCrunch AI

谷歌在 Workspace 推出 Pics 进军 AI 设计

·#google-i-o

谷歌在 Workspace 推出 Pics 进军 AI 设计

在 Google I/O 上,谷歌发布了 Pics,这是一款面向 Google Workspace 的新 AI 设计和图像生成应用。它先向 I/O 现场测试者开放,并将在今年夏天向 Google AI Ultra 订阅用户推出。

这让谷歌更直接地进入 AI 设计工具市场,并开始与 Canva 以及 Anthropic 的 Claude Design 等 AI 原生产品竞争。它之所以重要,是因为视觉内容创作正在变成主流生产力功能,尤其适合需要快速生成、可编辑内容的企业和普通 Workspace 用户。

谷歌在年度 I/O 大会上宣布推出 Pics,这是一款面向 Google Workspace 的 AI 设计和图像生成应用。谷歌将其定位为人人都能使用的工具,包括教师和小企业主,而不只是专业设计师。用户只需输入文本提示,就可以生成社交媒体图、邀请函、营销材料和原型图等内容。谷歌显然希望借此挑战 Canva 等成熟设计平台,同时也要与 Anthropic 的 Claude Design 这类 AI 原生产品竞争。公司认为,AI 设计正在迅速变成一个重要的竞争战场。

谷歌也承认,现有图像模型虽然能生成高质量图片,但只修改图片中的某个小部分仍然很困难,通常要重新写提示词并重新生成。Pics 的思路是让生成结果本身也能被轻松编辑。Gemini 负责编辑层,用户既可以通过新的提示词修改,也可以像在 Google Docs 中一样点击具体部分并留下评论,甚至直接手动修改。Pics 由 Nano Banana 2 提供支持,谷歌称它有助于实现更准确的文字渲染、现实世界知识和更细致的视觉输出。完成设计后,用户可以下载、复制、打印、分享,也可以交给其他人做最后一轮修改。

Pics 面向没有编辑技能的用户,可以通过文本提示生成社交媒体图、邀请函、营销素材和原型图。谷歌表示,Gemini 负责编辑层,而 Nano Banana 2 则用于更精确的文字渲染、现实世界知识和细致的视觉输出。

查看单篇正文查看原文
33

TechCrunch AI

Google为搜索加入持续运行的AI代理

·#google-search

Google为搜索加入持续运行的AI代理

在 Google I/O 2026 上,Google 发布了新的搜索代理功能,允许用户创建、自定义并管理多个 AI 代理。这些代理可以在后台持续运行,监控感兴趣的话题,并在不需要一次次手动搜索的情况下提供综合更新。

这意味着搜索从被动工具转向持续性的助手,可能改变人们跟踪新闻、市场、旅行和其他快速变化主题的方式。这也反映出整个行业正在转向 agentic AI 系统,即不仅响应提示,还会主动执行工作的方向。

在 Google I/O 2026 上,Google 为 Search 推出了新的 agentic 能力。公司表示,用户将可以创建、自定义并管理多个 AI 代理,让它们持续关注自己感兴趣的话题。与传统搜索需要用户主动输入查询不同,这些信息代理被设计为在后台持续运行。Google 将它们描述为比 2003 年推出的 Google Alerts 更进一步,因为它们不只是发送通知。它们不会只返回链接列表,而是可以整合多个来源的信息,解释某个变化为什么重要,对比不同观点,并给出可执行的下一步建议。

Google 举出的例子包括跟踪特定股票、财报、机票价格、体育赛事、突发新闻、住房趋势、就业市场、天气和交通等。用户可以在 Search 的 AI Mode 中输入提示来使用该功能,例如要求系统跟踪电影《The Mandalorian and Grogu》附近的电影票;当出现相关信息时,Google 应用会发送推送通知。用户还可以在 AI Mode 历史记录里查看正在跟踪的话题,并对提醒进行调整或关闭。Google 表示,这些信息代理将于今年夏天先向美国的 Google AI Pro 和 Ultra 订阅用户推出,随后再扩展到更多市场。同一场主题演讲中,Google 还宣布了 Search 的重大改版,包括重新设计的智能搜索框和新的 AI 查询建议系统,以支持更长、更对话式的搜索。

用户可以在 Search 的 AI Mode 中输入提示来启用这些代理,例如跟踪附近电影票;当出现相关信息时,Google 应用会发送推送通知。Google 还表示,这项功能将于今年夏天先向美国的 Google AI Pro 和 Ultra 订阅用户推出,之后再扩展到其他市场。

查看单篇正文查看原文
34

TechCrunch AI

Ocean 融资 2800 万美元对抗 AI 钓鱼

·#cybersecurity

Ocean 融资 2800 万美元对抗 AI 钓鱼

Ocean 是一家代理式邮件安全初创公司,刚刚结束隐身并宣布累计融资 2800 万美元,本轮由 Lightspeed Venture Partners 领投。该公司表示,它使用 AI 和定制的小语言模型分析来信上下文,用于阻止 AI 驱动的钓鱼和冒充攻击。

AI 降低了发起高针对性钓鱼攻击所需的成本和技能门槛,这让企业邮箱安全面临更大挑战。专门应对这一变化、且获得充足融资的初创公司,可能会影响企业在攻击更自动化、个性化时如何保护收件箱。

Shay Shwartz 创办 Ocean 的经历,始于他年轻时接触黑客攻击,这也让他从进攻转向防御。此后大约十年里,他在以色列精英国防和情报单位从事高级网络安全工作,其中包括与 Iron Dome 相关的项目,之后又加入了后来被 HPE 收购的 Axis。两年前,他决定创办自己的公司,打造面向 AI 时代的邮件安全产品。如今,Ocean 正式结束隐身,并宣布累计融资 2800 万美元。该轮融资由 Lightspeed Venture Partners 领投,Picture Capital 和 Cerca Partners 参投,同时还有多位知名天使投资人加入。

投资人包括 Wiz 的联合创始人兼 CEO Assaf Rappaport,以及 Armis 的联合创始人 Yevgeny Dibrov 和 Nadir Izrael。Shwartz 认为,AI 让钓鱼攻击发生了质变,因为攻击者可以借助 LLM 自动研究目标并生成高度个性化的邮件,从而让鱼叉式钓鱼更容易规模化。Ocean 的做法是用针对邮件场景训练的小语言模型,分析每封来信的上下文和意图。公司称,这套系统可以识别欺诈和冒充尝试,并且已经每月为 Kayak、Kingston Technology 和 Headspace 等客户处理数十亿封邮件。

Ocean 表示,它已经在为包括 Kayak、Kingston Technology 和 Headspace 在内的客户每月审查数十亿封邮件。创始人 Shay Shwartz 曾在以色列国防和情报体系工作,包括与 Iron Dome 相关的项目;他表示,产品会把发件人意图与组织上下文结合评估,而不只是依赖传统钓鱼检测。

查看单篇正文查看原文
35

TechCrunch AI

OpenAI 为 AI 图片添加溯源信号

·#openai

OpenAI 为 AI 图片添加溯源信号

OpenAI 宣布,其图片产品将开始使用 C2PA 元数据和 Google 的 SynthID 水印,来标识图片是否由其模型生成。公司还在预览一个公开验证工具,用于检查图片是否来自 OpenAI 系统。

这对图像溯源是一个现实可用的推进,因为在 AI 生成内容越来越难与真实内容区分的环境里,可信标记变得很重要。它可能提升用户、媒体和平台的信任度,不过这些保护目前只覆盖 OpenAI 自家工具生成的图片。

OpenAI 表示,它正在其图片生态中加入新的内容溯源信号,帮助人们判断一张图片是否由其模型生成。公司采用了 C2PA 这一开放标准,把 AI 生成信息写入文件元数据。与此同时,OpenAI 还与 Google 合作,引入 SynthID 这一隐形水印,目标是在截图、缩放或数字篡改后仍然能够被检测出来。OpenAI 说,这两种方式是互补的:元数据可以提供更丰富的信息,而水印则更耐久、更难被抹除。

公司还在预览一个公开验证工具,可以同时检查这两种信号,并帮助用户测试图片是否由 OpenAI 生成。该工具最初只支持 OpenAI 产品生成的图片,但 OpenAI 希望未来逐步扩大覆盖范围。需要注意的是,这些保护措施不会作用于其他 AI 系统生成的图片,因此无法解决整个生态中的全局溯源问题。报道还指出,基于元数据的标记自 2024 年以来就已经存在,但相对容易被绕过,因此更稳固的水印层很重要。

C2PA 会把溯源信息写入元数据,这种方式容易读取,但也相对容易被修改或移除;而 SynthID 设计上可以在截图、缩放和其他变换后仍然保留。OpenAI 表示,这两种方法是互补的:元数据能承载更多信息,而水印更难被擦除。

查看单篇正文查看原文
36

TechCrunch AI

谷歌推出 Universal Cart 并扩展代理支付

·#google

谷歌推出 Universal Cart 并扩展代理支付

在 Google I/O 上,谷歌发布了 Universal Cart,这是一个代理式购物中心,允许用户把来自谷歌各项服务中的商品集中到同一个地方。谷歌还宣布更新 Agent Payments Protocol(AP2),并表示这项技术将在未来几个月进入谷歌产品,使代理在用户授权下代为付款。

这意味着 AI 助手正从“推荐工具”走向“交易代理”,可能重塑人们在线发现、比较和购买商品的方式。它也让谷歌在购物与支付流程中拥有更强的位置,这会影响零售商、支付处理商以及所有构建 AI 商务基础设施的参与者。

谷歌在 I/O 主题演讲中发布了 Universal Cart,这是一种新的代理式购物中心,用于在谷歌产品和服务之间统一管理购物流程。用户可以把来自 Search、Gemini、YouTube 和 Gmail 的商品加入同一个购物车,这样购物就不必在每个网站或设备上重新开始。加入购物车后,谷歌可以代表用户追踪折扣、价格历史、补货情况和其他购物信号。这个系统建立在一个现实之上:很多购买行为会跨越多天、多个设备以及多个商家完成。谷歌还表示,Universal Cart 会利用 AI 帮助用户做出更好的决策,例如识别电脑配件之间的兼容性问题,并给出替代建议。

由于它基于 Google Wallet,系统还可以帮助用户发现隐藏优惠,并提高积分的使用效率。谷歌的 Universal Commerce Protocol(UCP)允许用户通过参与商家直接在谷歌完成结账,也可以把商品转到商家网站继续购买。Universal Cart 目前已在美国上线,夏季将进入 Gemini 应用,之后还会扩展到 YouTube 和 Gmail;与此同时,UCP 也会扩展到酒店和本地外卖等类别,并逐步覆盖更多国家。谷歌还更新了 AP2,这是一套允许 AI 代理在预设限制内代表用户付款的协议,并表示未来几个月会把它引入自家产品。AP2 的设计目标是为用户、商家和支付处理方建立可验证的连接,同时通过加密、防篡改记录和审计轨迹来支持争议处理和退货。

Universal Cart 可以追踪折扣、监控降价、展示价格历史,并在商品补货时提醒用户;它还可以标记兼容性问题,例如电脑配件之间不匹配。AP2 增加了品牌和商品偏好、消费上限等限制,谷歌还表示该协议使用加密、防篡改数字记录和审计轨迹,以支持退货和争议处理。

查看单篇正文查看原文
37

TechCrunch AI

Google 为 Gemini 加入 Daily Brief、Spark 和 Omni

·#google-gemini

Google 为 Gemini 加入 Daily Brief、Spark 和 Omni

在 Google I/O 2026 上,Google 宣布为 Gemini 应用推出多项重大更新,包括个性化的 Daily Brief、重新设计的界面、名为 Gemini Omni 的新视频模型,以及新的个人 AI 代理 Gemini Spark。Google 表示,这些变化是其将 Gemini 打造成 AI 中枢而不只是聊天机器人的更大计划的一部分。

这些更新通过把日常生产力、多模态创作和代理能力整合到一个应用中,强化了 Gemini 与 ChatGPT 和 Claude 的竞争力。它们也表明 Google 正在尝试让 Gemini 更深入地嵌入用户的工作和媒体流程,而不只是用于对话问答。

在周二举行的年度 Google I/O 活动上,Google 为 Gemini 应用公布了一系列重要更新。最引人注目的新功能包括个性化 Daily Brief、重新设计的界面、新的视频模型 Gemini Omni,以及名为 Gemini Spark 的个人 AI 代理。Google 将这些变化定位为把 Gemini 从单一聊天机器人升级为更广泛的 AI 中枢的一部分。公司也明确表示,这一方向旨在增强其与 ChatGPT 和 Claude 等主要竞争对手的竞争力。Daily Brief 的定位是用户每天早晨的第一站,它会把收件箱、日历和任务中的内容整合成一个总览。Google 表示,它不仅会做摘要,还会对事项进行优先级排序并建议下一步行动。该功能今天就开始向美国的 Google AI 订阅用户推送。Google 还表示,Gemini 已经拥有超过 9 亿月活用户,并覆盖 230 多个国家和地区、支持 70 多种语言。

与此同时,Gemini 应用本身也被重新构建,采用名为 Neural Expressive 的新设计语言,加入更流畅的动画、更鲜明的色彩、新字体和触觉反馈。Gemini 的回答呈现方式也进行了调整,重点信息会以加粗形式显示在顶部,而不再是整屏密集文本。Gemini Spark 被描述为一个 24/7 运行的个人 AI 代理,即使手机锁屏后也能在后台继续工作,并支持用户创建自定义工作流。Google 表示,Spark 目前仍在测试中,预计下周向 Google AI Ultra 订阅用户开放。Gemini Omni 则是一个新的视频模型,它把 Gemini 与 Google 的生成式媒体模型结合起来,生成基于知识约束的输出,例如把“黏土定格动画风格的蛋白质折叠讲解”这类提示词转成视频。Google 还表示,该模型可以接收音频、图像和视频输入,以生成一致且高质量的结果。该模型将通过 Google Flow 和 YouTube Shorts 向 Google AI 订阅用户推出,体现出 Google 对多模态内容创作工具的进一步投入。

Daily Brief 会从用户的收件箱、日历和重要任务中提取信息,按优先级整理并建议下一步行动;它今天开始向美国的 Google AI 订阅用户推出。Gemini Spark 是一个基于云的个人代理,即使手机锁屏也能继续工作,预计下周向 Google AI Ultra 订阅用户开放;而 Gemini Omni 则会通过 Google Flow 和 YouTube Shorts 向 Google AI 订阅用户推出。

查看单篇正文查看原文
38

The Decoder

Google 将 AI 订阅重组为三档

·#google

Google 将 AI 订阅重组为三档

Google 在 I/O 2026 上宣布重组其 AI 订阅,改为三档:AI Plus 每月 7.99 美元,AI Pro 每月 19.99 美元,AI Ultra 每月 99.99 美元。公司还把此前最高档价格从 250 美元下调到 200 美元,并从每日提示词限制转向按算力消耗计费的使用模型。

这意味着 Google 的 AI 服务从单纯的订阅包转向更强调使用量的产品体系,会影响轻度和重度 Gemini 用户的付费方式。它也反映出整个行业正在向按消耗计费转变,尤其适用于成本更高的多模态和智能体类 AI 工作负载。

Google 在 I/O 2026 上重组了其 AI 订阅体系,用更清晰的三档产品取代了原有结构。新的订阅分别是 Google AI Plus,每月 7.99 美元;Google AI Pro,每月 19.99 美元;以及 Google AI Ultra,每月 99.99 美元。Google 还将此前最高档的价格从 250 美元下调到 200 美元。除了价格变化之外,公司还把原先按日计算的提示词限制,改为按算力消耗计费的模式。按照这一机制,简单文本请求消耗的额度更少,而视频生成或编码等更重的任务会消耗更多额度;额度每五小时重置一次,直到触发每周上限。若用户用尽额度,系统会自动切换到更小的模型,Pro 和 Ultra 订阅者还可以为 Google Antigravity 和 Google Flow 购买额外点数,Gemini 应用的额外点数也将在之后推出。新的订阅变化同时配套了一系列 Gemini 生态功能。

AI Plus 包含 200 GB 存储和 Gemini 双倍使用额度,AI Pro 包含 5 TB 存储、四倍额度、Pro 模型访问权限以及 YouTube Premium Lite,而 AI Ultra 提供最高 20 倍额度、20 TB 存储、完整的 YouTube Premium 和最高级别的 AI 工具。Google 还表示,Health Premium 和 Home Premium 会随 Pro 和 Ultra 免费捆绑。新功能包括 Gemini Omni,可根据文本、图片和视频输入创建和编辑视频;以及 Gemini 3.5 Flash,用于快速测试和调试。Ultra 订阅者将率先以 beta 形式在美国获得 Gemini Spark,这是一种可在 Google 产品之间自动执行任务的 AI 智能体,同时还能使用 Project Genie,用于构建交互式世界。Gmail 中的 AI Inbox 和 Gemini 应用里的 Daily Brief 也将上线,但首发仅限美国。Google 说明,AI Inbox 会突出显示重要任务、建议回复并关联 Docs、Sheets 和 Slides;Daily Brief 则会汇总 Gmail、Calendar 和 Gemini 聊天中的早间信息。此外,公司还预告了 Google Pics,以及 Gmail、Docs 和 Keep 中的新语音功能,这些面向 Pro 和 Ultra 的功能预计将在今年夏天推出。

AI Plus 包含 200 GB 存储空间和 Gemini 双倍使用额度,AI Pro 包含 5 TB 存储、四倍额度、Pro 模型以及 YouTube Premium Lite。AI Ultra 则提供最高 20 倍额度、20 TB 存储、完整的 YouTube Premium,并可使用 Gemini Spark 和 Project Genie,不过部分功能在发布初期仅限美国或处于测试阶段。

查看单篇正文查看原文
39

The Verge AI

Google 的搜索框正变成 AI 指挥中心

·#google-search

Google 的搜索框正变成 AI 指挥中心

The Verge 认为,Google 在 I/O 上公布的新功能表明,Search 正在从“找链接”的工具转变为一个由 AI 驱动的界面,能够回答问题、生成定制结果,并在 Google 各产品之间执行任务。文章把 AI Mode、个性化搜索体验、Gemini 升级以及新的购物和媒体生成能力视为这一转变的证据。

这很重要,因为 Google Search 仍然是网络上最关键的入口之一,而转向“直接完成任务”可能会重塑人们发现、比较和使用信息的方式。如果它足够可靠,日常工作流会更快;如果在准确性或隐私上出问题,影响也会很大,因为它会触及 Gmail、Calendar、Workspace、Search 和 YouTube。

The Verge 这篇文章认为,Google 最近在 I/O 上展示的内容,说明它的目标远不只是把搜索做得更好。文章指出,Google 正在把搜索框变成一个通用入口,让用户不仅能提问和查找信息,还能总结、跟踪,甚至直接完成任务。作者把 Search、Gemini、Workspace、购物、YouTube 和媒体生成等多个方向的新功能串联起来,认为它们指向同一个未来。就 Search 而言,Google 据称正在让搜索框变得更动态,加入超越自动补全的 AI 建议,并推动用户进入 AI Mode,在那里系统会用 AI 生成的页面取代传统的蓝色链接列表。搜索结果也可能变得更个性化、更可视化,Google 可以直接在结果页生成交互式图表和定制 UI。文章还提到,用户可以从搜索框创建“信息代理”,用来持续追踪球鞋发售或房源信息,这让 Search 更像一个升级版的 Google Alerts。

除了搜索之外,Gemini 也在获得新能力,比如从 Gmail 和 Calendar 中提取信息生成 Daily Brief,以及通过 Gemini Spark 创建自定义代理。Workspace 中的 Gmail、Docs 和 Keep 也被推向一种对话式工作流,用户可以直接让应用解析收件箱、起草文档或生成待办清单。购物方面,Google 正在推出 Universal Cart,把 Search、Gemini、Gmail 和 YouTube 里的商品统一收集,并通过 Google 的支付体系结账。YouTube 也在测试类似 AI Mode 的结果页,而 Gemini Omni 模型则朝着多模态媒体生成迈进,可以用视频、图片和音频作为提示生成视频。文章的核心担忧是:如果 Google 能把这一切做对,这会非常有用;但它要求 AI 在复杂任务和敏感数据上都保持高度准确,这个门槛非常高。作者最后认为,Google 的终局很可能是一个“Ask Google”式的统一搜索框,但这种未来未必符合所有用户对互联网的期待。

文章提到的功能包括:会动态扩展的搜索框、超越自动补全的 AI 建议、用 AI Mode 页面替代传统链接列表,以及可追踪球鞋发售或公寓房源等信息的“信息代理”。文章也指出,这些更深层的整合要求 Google 正确处理复杂查询和敏感个人数据,因此对准确性提出了极高要求。

查看单篇正文查看原文
40

The Verge AI

Google将语音AI带入Gmail、Docs和Keep

·#google

Google将语音AI带入Gmail、Docs和Keep

Google宣布推出Gmail Live,这是一种由Gemini驱动的Gmail语音模式,用户可以直接用自然语言询问收件箱内容,而不必输入搜索词。公司还预告了面向Docs和Keep的语音驱动AI功能,计划从今年夏天开始在移动端向Google AI Pro和Ultra订阅用户推送。

这把邮件搜索变成了对话式交互,可能会让用户更快找到埋在长邮件线程里的关键信息。若其准确性足够高,它可能明显改变人们使用Gmail的方式,并将Google的AI生产力布局扩展到核心消费级应用中。

Google正在推出Gmail Live,这是Gmail中的一种新AI语音模式,本质上可以看作是专门为邮箱打造的Gemini Live版本。用户只需点击搜索栏里的一个图标,然后直接开口说话,就能用对话方式检索收件箱,而不必手动输入关键词。Google在一次简报中演示了这项功能:系统从用户邮件里提取了孩子学校展示活动的日期和地点,以及一趟前往Detroit的行程信息。这个演示说明,Gmail Live有望减少在大量搜索结果中翻找单条信息的麻烦,尤其适合只需要某个具体细节的场景。与此同时,Google也承认这项功能必须足够可信,因为一旦用于航班确认码、紧急预约信息等场景,准确性就非常关键。

Gmail产品副总裁Blake Barnes表示,公司花了很多时间确保用户得到的是可以信赖的产品,而且Gmail Live还会显示答案来源,方便用户自行核对。除了Gmail,Google还在Docs和Keep中加入语音驱动的AI功能:Docs Live可以帮助整理思路并结合Gmail和Google Drive中的信息生成文档,Keep则能把口头想法整理成提醒事项和购物清单。这些功能都将在今年夏天率先面向移动端的Google AI Pro和Ultra订阅用户推出,其中Keep的升级最先只支持Android。Google同时还在扩大Gmail AI Inbox的覆盖范围,该功能更像是面向邮件的AI搜索模式,现已向Ultra用户开放,并将向Pro和Plus用户推出。

Gmail Live会以一个图标出现在搜索栏中,并且可以回答追问、在被打断后切换问题,还会展示信息来源。Google强调该功能围绕“可信”设计,因为用户可能会依赖它查找航班确认码、预约时间或门锁密码等关键信息。

查看单篇正文查看原文
41

ZDNET AI

Google I/O 2026 聚焦 Gemini 与 Android XR

·#google-i-o

Google I/O 2026 聚焦 Gemini 与 Android XR

Google I/O 2026 于 5 月 19 日至 20 日在山景城的 Shoreline Amphitheater 开幕,ZDNET 对开场主题演讲进行了直播报道。此次大会的重点是谷歌推动 Gemini、代理式 AI、Android XR 以及新的 Googlebook 设备更深入地融入其产品体系。

Google I/O 是谷歌塑造开发者预期和产品战略的重要舞台,因此其发布内容会影响更广泛的 Android 和 AI 生态。此次强调代理式 AI 与 Gemini 跨产品整合之所以重要,是因为这反映了谷歌如何在与 OpenAI 和 Anthropic 竞争的同时,重塑搜索、Workspace 和设备上的日常使用体验。

ZDNET 的直播博客报道了 Google I/O 2026 的开幕情况,这是一年一度的谷歌开发者大会。大会于 5 月 19 日至 20 日在加州山景城的 Shoreline Amphitheater 举行。谷歌此前已经通过预告来制造期待,内容包括新的 Googlebook 设备,以及多项深度融入 AI 的 Android 更新。文章指出,谷歌传达的核心信息一直很明确:Gemini 正在被放到更多产品和场景中,而公司希望让代理式 AI 更容易被使用。

这样的战略背景是,谷歌正面临来自 OpenAI 和 Anthropic 的激烈竞争,这两家公司都在短时间内快速推出新模型和编程功能。文章也提到,并不是所有用户都欢迎谷歌把 AI 助手更明显地嵌入搜索、Workspace 和其他日常界面。ZDNET 表示将现场报道这些发布内容,并提醒读者可以通过公开直播观看主题演讲。

主题演讲定于周二太平洋时间上午 10 点 / 东部时间下午 1 点举行,谷歌也向公众提供了直播。文章指出,谷歌在上周已经预告了一些内容,包括 Googlebook 设备和深度整合 AI 的 Android 更新,但这篇直播报道本身并未给出具体产品规格。

查看单篇正文查看原文
42

ZDNET AI

Google 推出 Gemini Omni 生成 AI 视频

·#ai-video-generation

Google 推出 Gemini Omni 生成 AI 视频

Google 发布了 Gemini Omni,这是一项新的 AI 视频能力,可以根据文本、图片、音频或视频输入生成视频。该功能将从 Gemini Omni Flash 开始推出,并会进入 Gemini 应用、Google Flow 和 YouTube Shorts。

如果其表现符合描述,Omni 可能会降低制作高质量视频的门槛,并改变 Google 生态中的创作流程。与此同时,基于头像的视频克隆也会带来关于授权、真实性以及合成媒体扩散的明显担忧。

Google 发布了 Gemini Omni,并将其描述为一项新的 AI 视频能力,目标是把视频生成提升到一个新的层级。公司把这次发布类比为此前 Nano Banana 对图像生成带来的提升,暗示 Omni 也可能显著改变视频创作方式。根据 Google 的说法,Omni 可以把文本、图片、音频和视频作为输入,并生成基于 Gemini 现实世界知识的高质量视频。该功能将从 Gemini Omni Flash 开始推出,并会接入 Gemini 应用、Google Flow 和 YouTube Shorts。文章提到,目前还不清楚 Gemini 的网页版本是否会直接支持 Omni,或者用户是否必须通过浏览器中的 Flow 界面使用。

最引人注目的功能之一是头像式视频克隆,用户可以创建一个看起来并听起来都像自己的数字版本来生成视频。Google 表示,这些视频会内置 SynthID 指纹,以便验证其由 AI 生成。公司同时说明,涉及音频和语音编辑的更广泛视频编辑能力仍在测试中,团队希望以负责任的方式再向用户开放。文章整体认为,Omni 既可能帮助创作者更轻松地产出视频,也可能让网络上出现更多低质量 AI 内容,并进一步加剧信任问题。

Google 表示,Omni 将 Gemini 的推理能力与视频生成结合起来,并可基于 Gemini 的现实世界知识来生成内容。公司还表示会使用 SynthID 数字水印进行验证,同时说明除头像功能之外的音频和语音编辑仍在测试中,以确保负责任地推出。

查看单篇正文查看原文
43

Google AI Blog

Google称AI模式正在重塑美国搜索行为

·#ai-search

Google称AI模式正在重塑美国搜索行为

Google表示,去年在美国推出的AI Mode如今全球月活跃用户已超过10亿。公司还称,自上线以来,AI Mode 的查询量每个季度都翻了一倍多,同时整体搜索活动也在增长。

这一更新表明,Google 的 AI 搜索功能不只是新鲜功能,而是推动用户参与度和搜索方式变化的重要力量。如果这种趋势持续下去,搜索产品可能会朝着文本、语音和图像输入并重的方向演进,从而影响用户和内容发布者。

Google 表示,AI Mode 于一年前在美国上线,如今全球月活跃用户已经超过 10 亿。公司称,自上线以来,AI Mode 的查询量每个季度都增长超过一倍,并将其视为整体搜索使用量创历史新高的重要原因之一。Google 认为,新的 AI 功能正在把传统搜索与对话式 AI 连接起来,因此不仅用户搜索得更多,提问方式也变了。根据其美国数据,现在超过六分之一的搜索使用语音或图片,图片搜索的环比增长超过 40%。

Google 还表示,AI Mode 的平均查询长度是传统 Search 查询的三倍,说明用户在用它提出更复杂的问题。在具体用途上,与规划相关的查询在过去六个月里的增长速度比 AI Mode 整体查询快 80%。此外,偏向头脑风暴的查询自上线以来比整体 AI Mode 查询快 30%,像“where to”“where should I”“ideas for”这类表达也在增加。整体来看,这篇更新强调 AI Mode 不只是改变了搜索形式,也在扩展“什么算可搜索”的范围。

Google称,美国现在每六次搜索中就有一次以上使用语音或图片,图片搜索环比增长超过40%。公司还表示,AI Mode 的平均搜索长度是传统搜索查询的三倍,而与规划相关的查询在过去六个月里的增长速度比 AI Mode 整体查询快 80%。

查看单篇正文查看原文
44

Google AI Blog

Google Workspace新增语音、图像和收件箱AI工具

·#google-workspace

Google Workspace新增语音、图像和收件箱AI工具

Google 发布了一组面向 Workspace 的 AI 更新,包括 Gmail、Docs 和 Keep 中的语音功能、新的图像应用 Google Pics、扩展后的 AI Inbox 功能,以及名为 Gemini Spark 的个人 AI 代理。公司表示,这些功能会面向不同的 Google AI 和 Workspace 订阅层级逐步推出,其中部分已在今年夏季向企业客户预览。

这些变化把 AI 更深入地嵌入到数十亿人日常使用的工具里,可能显著改变写作、整理和搜索工作的方式。如果这些功能表现稳定,它们会减少普通用户和企业用户在 Gmail、Docs、Drive 等 Workspace 应用中的操作摩擦。

Google 表示,超过 40 亿用户依赖 Gmail、Docs 和 Drive 等 Workspace 应用,而现在它正在为这些产品加入一组新的 AI 功能。此次发布主要包括四个方向:语音能力、新的图像应用、扩展的 AI 收件箱工具,以及 Gemini 应用中的个人 AI 代理。Google 将这些更新描述为帮助用户更快地进行头脑风暴、整理信息和完成任务。 在 Gmail 中,新功能 Gmail Live 允许用户直接用语音提问,例如查询航班登机口或孩子学校的最新消息,并通过搜索收件箱得到综合答案。 在 Docs 中,Docs Live 充当语音驱动的思考伙伴和共同写作者,帮助用户更快起草文档,并在获得许可后从 Gmail、Drive、Chat 和网页中提取相关信息。

在 Keep 中,用户可以直接口述内容,系统会在后台把这些零散想法整理成有结构的笔记和列表。 Google 还推出了 Google Pics,这是一款基于最新 Nano Banana 模型的图像创建与编辑应用,支持按对象精确编辑,以及修改或翻译照片中的文字。 最后,Gemini Spark 被定位为一个 24/7 的个人 AI 代理,可以在用户指示下帮助处理数字生活事务,并与 Workspace 应用集成。Google 表示,这些语音功能会先向 Google AI Pro 和 Ultra 订阅用户开放,并在今年夏天向 Google Workspace 企业客户提供预览。

Gmail Live 允许用户用语音搜索收件箱并获得综合答案;Docs Live 可以把口述内容整理成文档结构,并在用户许可下从 Gmail、Drive、Chat 和网页中提取上下文。Google Pics 被定位为基于 Nano Banana 模型的高精度图像编辑工具,支持对象级编辑和图片内文字翻译;Gemini Spark 则被描述为一个 24/7 个人 AI 代理,可在用户指令下行动并与 Workspace 应用集成。

查看单篇正文查看原文
45

MIT Technology Review AI

马斯克因诉讼时效败诉OpenAI案

·#openai

马斯克因诉讼时效败诉OpenAI案

陪审团一致作出建议性裁决,认定埃隆·马斯克起诉 OpenAI 的时间太晚,因此他的诉求因诉讼时效问题被阻却。美国联邦地区法官 Yvonne Gonzalez Rogers 随即接受了这一结论,马斯克则表示将提起上诉。

这项裁决在不审理马斯克核心指控是否成立的情况下,就阻止了他对 OpenAI 公司结构的高调挑战。它也凸显了 AI 公司从非营利使命转向营利融资模式时所引发的治理与法律冲突,这类争议会影响创始人、捐赠者和监管者。

陪审团一致作出建议性裁决,认定埃隆·马斯克起诉 OpenAI 的时间太晚,因此他的诉求因诉讼时效问题被阻却。美国联邦地区法官 Yvonne Gonzalez Rogers 随即接受了这一结论,马斯克则表示将提起上诉。 这项裁决在不审理马斯克核心指控是否成立的情况下,就阻止了他对 OpenAI 公司结构的高调挑战。

它也凸显了 AI 公司从非营利使命转向营利融资模式时所引发的治理与法律冲突,这类争议会影响创始人、捐赠者和监管者。 OpenAI 认为,违反慈善信托的主张适用三年诉讼时效,不当得利主张适用两年诉讼时效,因此马斯克最迟应在 2021 年或 2022 年前起诉。庭审证词重点围绕更早的关键节点展开,包括马斯克本人 2017 年参与设立子公司的设想,以及 OpenAI 在 2019 年引入 Microsoft 资金并进行封顶利润重组。

OpenAI 认为,违反慈善信托的主张适用三年诉讼时效,不当得利主张适用两年诉讼时效,因此马斯克最迟应在 2021 年或 2022 年前起诉。庭审证词重点围绕更早的关键节点展开,包括马斯克本人 2017 年参与设立子公司的设想,以及 OpenAI 在 2019 年引入 Microsoft 资金并进行封顶利润重组。

查看单篇正文查看原文
46

TechCrunch AI

马斯克的 OpenAI 官司暴露了相似做法

·#openai

马斯克的 OpenAI 官司暴露了相似做法

陪审团驳回了埃隆·马斯克针对 OpenAI 创始人和 Microsoft 提起的诉讼,而 TechCrunch 的庭审报道指出,庭审证据让马斯克的主张显得很薄弱。文章还认为,审理过程揭示了马斯克自己也曾以类似方式受益于 OpenAI 的非营利资源。

这一裁决削弱了围绕 OpenAI 公司结构和治理的最引人关注的法律挑战之一。它也表明,这场争议不只是关于 Altman 的行为,还涉及 OpenAI 的非营利使命、人才和资源如何被创始人以及马斯克本人使用的更大历史。

TechCrunch 报道称,陪审团很快驳回了埃隆·马斯克针对 OpenAI 其他创始人和 Microsoft 的诉讼,这与文章的判断一致:这起案件从一开始就很薄弱。结案陈词中,OpenAI 的律师给出了细致的法律辩护,而马斯克一方则把重点放在 Sam Altman 的可信度,以及创始人是否存在不当牟利上。判决公布后,马斯克发布了一条后来被删除的帖子,攻击法官 Yvonne Gonzalez Rogers,并表示要上诉。他仍然坚持 Altman 和 Greg Brockman“偷走了一个慈善机构”,但文章认为庭审显示这些指控站不住脚。

一个关键原因是证词表明,马斯克本人也以不太好与其主张相协调的方式受益于 OpenAI。Greg Brockman 说,马斯克在 2017 年要求他把一批 OpenAI 研究人员带到 Tesla,为 Autopilot 团队工作几周,而且这件事实际上很难拒绝。Brockman 表示,这些研究人员帮助改进了 Tesla 的自动驾驶技术,Tesla 没有补偿 OpenAI 的时间和人力,马斯克甚至还要求他推荐应该解雇哪些员工,但他拒绝了。文章还指出,马斯克在 2017 年花了很长时间试图获得一个可能的 OpenAI 营利附属机构的单独控制权,这让他关于“违反慈善信托”的理论更难成立。

文章强调了这样一段证词:马斯克在 2017 年要求 Greg Brockman 把包括 Andrej Karpathy 和 Ilya Sutskever 在内的 OpenAI 研究人员带到 Tesla,无偿帮助 Autopilot 团队。文章还指出,马斯克曾花了数月试图获得拟议中的 OpenAI 营利附属机构的单独控制权,这使他关于他人不当利用非营利资产的指控更加复杂。

查看单篇正文查看原文
47

The Decoder

Mistral AI 收购 Emmi AI

·#mistral-ai

Mistral AI 收购 Emmi AI

Mistral AI 已收购位于维也纳的 Emmi AI,这是一家专注于工业场景物理 AI 的初创公司。交易金额未披露,Mistral 表示此举将扩展其面向欧洲工业客户的产品能力。

这笔收购为 Mistral 在工业和物理仿真工作流方面增加了能力,而这些能力对航空航天、汽车和半导体等行业很重要。它也强化了 Mistral 争取欧洲企业 AI 预算的策略,不只是提供通用模型,而是提供面向行业场景的系统。

Mistral AI 已收购位于维也纳的 Emmi AI,这是一家专注于工业应用物理 AI 的初创公司。公司表示,这笔收购将帮助其扩大面向欧洲工业客户的产品覆盖范围。此次交易的财务条款没有披露。Emmi AI 的专长是用 AI 模型模拟复杂的物理过程,包括气流、热传递和材料应力。路透社报道称,这家初创公司在 2025 年完成了 1500 万欧元融资,这是奥地利当年规模最大的融资轮之一。

Mistral 目前已经在为 ASML、Stellantis 和 Veolia 等工业客户开发定制 AI 系统。这些系统可用于检测生产缺陷或控制机械臂。CEO Arthur Mensch 表示,此次收购将增强 Mistral 在航空航天、汽车和半导体领域的地位。整体来看,这笔交易是 Mistral 加深欧洲工业 AI 布局的一步。

Emmi AI 开发的模型可以模拟气流、热传递和材料应力等物理现象。Mistral 本身也在为 ASML、Stellantis 和 Veolia 等客户开发定制 AI 系统,CEO Arthur Mensch 表示此次收购将增强其在航空航天、汽车和半导体领域的地位。

查看单篇正文查看原文
48

The Verge AI

Google的AI未来依赖个人数据与信任

·#google-ai

Google的AI未来依赖个人数据与信任

Google正在扩展Gemini功能,例如 Gemini Spark、Daily Brief,以及更深入的 Gmail 和 Workspace 集成,这些功能会利用个人数据来自动处理任务并个性化回复。公司还计划把访问范围扩展到第三方服务和 Mac 电脑上的本地文件,让 Gemini 更像一个贯穿用户数字生活的全天候助手。

这说明 Google 的 AI 战略越来越建立在访问高度个人化信息之上,这会让隐私、安全和用户信任变得更加关键。若用户接受这些集成,Google 可能凭借其生态内已掌握的数据,让 Gemini 更实用,并在竞争中获得重要优势。

Google 在 I/O 2026 上展示了一组 AI 功能,声称这些工具可以让日常生活更轻松,但文章认为,它们的核心依赖于用户对 Google 的信任。Gemini Spark 被定位为一种始终在线的 AI 代理,可以帮助安排活动、生成学习指南、根据会议纪要创建待办事项,甚至扫描信用卡账单中的隐藏订阅费用。Daily Brief 正在向 Google AI Plus、Pro 和 Ultra 订阅用户推出,它会扫描 Gmail 中的更新,并从 Calendar 中提取日程事件。Google 还在扩展 Gmail 的 AI 收件箱功能,使其能够根据邮件内容生成个性化回复和任务清单。文章指出,这些功能确实很实用,但它们依赖于对 Google 各项服务中大量个人数据的访问。

Google 早在 2024 年就开始朝这个方向推进,当时它把 Gemini 集成进 Gmail、Docs、Sheets、Slides 和 Drive 等 Workspace 应用,而 Gemini Deep Research 也已经可以把邮件、Drive 文件和聊天记录作为资料来源。到了 1 月,Google 又推出了 Personal Intelligence,使 Gemini 能在无需提示的情况下跨 Gmail、Google Photos、Search 和 YouTube 历史进行推理。Josh Woodward 在主题演讲中表示,每天有数百万人在使用 Personal Intelligence,用于推荐和人生重大决策。文章的核心观点是,Google 的 AI 未来建立在“可选但范围很广”的数据连接之上,而真正的问题是用户愿意开放多少个人信息。

Gemini Deep Research 可以把邮件、Drive 和聊天内容作为资料来源,而 Personal Intelligence 则能在无需提示的情况下跨 Gmail、Google Photos、Search 和 YouTube 历史进行推理。Google 表示这些功能都是可选的,但 Gemini Spark 未来可能还会访问 Mac 本地文件,并连接 Canva、OpenTable、Instacart、Spotify、Expedia 和 Adobe 等服务。

查看单篇正文查看原文
49

The Verge AI

Gemini 将识别沃尔沃 EX60 的停车标志

·#ai-assistants

Gemini 将识别沃尔沃 EX60 的停车标志

Google 和沃尔沃在 Google I/O 上宣布,Gemini 将能够使用即将推出的沃尔沃 EX60 外部摄像头,为驾驶者解读周围环境。首个公布的用途是翻译停车标志,未来还计划支持识别道路标志、车道线以及附近地标等视觉任务。

这让 Gemini 从对话式助手进一步变成更实用的车内视觉助手,能够减少日常驾驶中的操作摩擦。若其可靠性足够高,这将证明多模态 AI 在消费级汽车中具有实际价值,并强化车载嵌入式 AI 助手的应用前景。

Google 和沃尔沃在 Google I/O 上宣布,Gemini 将为即将上市的沃尔沃 EX60 SUV 增加一项新的多模态能力。这个助手可以调用车辆外部摄像头,帮助车主在驾驶或停车时理解周围环境。Google 表示,首个实际用途是解读停车标志,因为这类标志通常会说明可停车时长、是否需要许可证以及其他限制条件。公司还提到,这项能力未来可以扩展到识别道路标志、车道线,以及附近的地标或餐馆等地点信息。Google 的 Android Automotive 负责人 Patrick Brady 表示,这一方向的目标是让驾驶更有帮助,让用户在路上了解更多周围环境。

该功能之所以能够实现,是因为沃尔沃采用了基于 Google 的 Android Automotive 车机系统。它还依赖 EX60 搭载的 Qualcomm Snapdragon 处理器以及 OTA 远程软件更新能力。此次发布还包括 Google Maps 的改进:沃尔沃将成为首批获得新 Immersive Navigation 功能的车企之一,该功能会以 3D 方式渲染路线,并结合摄像头可见的地标信息提供更像对话的导航指引。报道也提醒,这类停车标志识别功能虽然可能很实用,但前提是识别必须足够准确,因为错误判断可能导致罚单,甚至车辆被拖走。

该功能依赖沃尔沃基于 Google 的 Android Automotive 车机系统,以及 EX60 搭载的 Qualcomm Snapdragon SoC 和 OTA 软件能力。Google 还表示,Maps 将通过新的 Immersive Navigation 模式获得更具对话感的导航能力,该模式会以 3D 方式渲染路线,并利用地标等摄像头上下文信息。

查看单篇正文查看原文
50

The Verge AI

Google wants to compete with Anthropic’s Mythos

·#ai-security

Google wants to compete with Anthropic’s Mythos

Google is expanding access to its CodeMender AI agent for code security as part of a broader push to compete with Anthropic’s security-focused AI offerings.

This is a noteworthy industry update about Google expanding its AI-driven code security tool, CodeMender, and positioning it against Anthropic’s security-focused model strategy. It has moderate relevance for AI and software security, but the article appears more like competitive commentary than a deep technical breakthrough; no discussion/comments were provided.

Google is making a big push into cybersecurity. At I/O, the company announced that it was inviting select groups of experts to test the API for CodeMender, an “AI agent for code security” it debuted last October. The difference is that Google is now making the tool more widely available externally — and marketing it as a way to, as Google DeepMind CTO Koray Kavukcuoglu put it, “help secure the world’s code bases” by both flagging and fixing vulnerabilities. Anthropic’s surprise Claude Mythos Preview announcement seemed to shock the AI world — and a ton of others, like top banks and the Federal Reserve chair.

查看单篇正文查看原文
51

The Verge AI

Google 扩展 AI 购物的 Universal Cart

·#google-i-o

Google 扩展 AI 购物的 Universal Cart

Google 在 I/O 上发布了 Universal Cart,它可以在 Search、Gemini 和其他 Google 产品之间跟踪购物,未来还会扩展到 YouTube 和 Gmail。这个系统还加入了价格追踪、到货提醒、折扣建议,以及对不兼容或有问题购买的警告。

这表明 Google 正在把 AI 做成一层电商基础设施,而不只是搜索或聊天工具。若用户采用率上升,它可能改变消费者在多个零售商和 Google 产品之间发现、比较并完成购买的方式。

Google 仍在大力投入 AI 购物工具,尽管一些竞争对手已经放缓或退缩。在 Google I/O 上,公司发布了 Universal Cart,旨在把用户在 Search、Gemini 以及未来的 YouTube 和 Gmail 上的购物行为统一起来。这个购物车的目标是把来自不同零售商的商品集中到一个地方,帮助用户管理跨天、跨设备、跨账号的购物过程,而不是不断打开很多标签页和切换配置。Google 广告与电商业务副总裁兼总经理 Vidhya Srinivasan 表示,这个产品是为了解决人们现实中分散购物的问题。

该购物车还会提供更实用的购物辅助功能,包括降价提醒、历史价格、补货通知、折扣建议,以及当用户的购买计划看起来有问题或不兼容时发出警告。Google 举的例子是第一次装机的用户选错了主板和 CPU 插槽,购物车会在结账前提示这个问题。用户还可以通过 Google Pay 连接会员计划和信用卡,系统会推荐可能更省钱的付款方式。如果用户不想通过 Google 完成结账,也可以把购物车内容转到零售商自己的网站上继续完成购买。

这个购物车可跨 Sephora、Target、Wayfair 和 Walmart 等零售商工作,用户如果不想通过 Google 结账,也可以把商品转到零售商自己的网站完成购买。Google 表示,基于 Gemini 的购物车还能识别例如主板和 CPU 插槽不兼容这类问题,并通过 Google Pay 连接会员计划和信用卡,给出省钱建议。

查看单篇正文查看原文
52

ZDNET AI

摩托罗拉 Smart Connect 几乎取代了笔记本

·#mobile-computing

摩托罗拉 Smart Connect 几乎取代了笔记本

ZDNET 报道称,摩托罗拉 Razr Fold 可以通过 Smart Connect 进入类似 Samsung DeX 的桌面模式。在这篇上手评测中,这部手机搭配便携显示器或 XREAL 智能眼镜使用,支持可调整大小的窗口、蓝牙键盘,并且手机本身还能当作触控板。

这说明折叠屏手机正在更接近真正替代笔记本的移动办公场景。对于本来就会携带外接显示器或智能眼镜、又希望获得更灵活桌面界面的用户来说,这尤其有意义,因为他们可能不必再带一台完整笔记本。

ZDNET 的评测指出,摩托罗拉的 Smart Connect 让 Razr Fold 拥有了类似 Samsung DeX 的桌面界面。连接外接显示器或智能眼镜后,手机会进入窗口化界面,应用可以像在笔记本上一样调整大小、拖动位置,并排排列。配合蓝牙键盘后,这套组合就能变成一个可用的桌面办公环境,而手机本身还可以充当触控板来控制光标。评测者分别测试了便携显示器和 XREAL 眼镜,认为这种体验既有趣又出乎意料地实用。

不过,这套方案也有明显取舍:便携显示器需要独立供电,因此它并不是完全靠手机供能的方案,而且显示器本身在包里占用的空间和笔记本差不多。摩托罗拉的 6000 毫安时电池在这种多任务使用场景下很有帮助,尤其是配合智能眼镜时,续航被认为优于类似的三星和 Google 手机。Smart Connect 还提供文件和照片共享、Windows PC 应用支持,以及游戏、视频聊天和电视等不同模式。总体来看,这篇文章把 Smart Connect 描述为摩托罗拉最强的软件特性之一,只是作者也承认,基于显示器的方案未必适合日常随身出行。

评测提到,Smart Connect 支持同时打开 10 个以上应用,并且还包含游戏、视频聊天和电视等其他模式。一个限制是便携显示器需要独立供电,而且 Chrome 不能像评测者希望的那样同时打开多个窗口来并排查阅资料。

查看单篇正文查看原文