Google I/O 2026 的100项 AI 和产品发布
Google AI Blog··作者 Keyword Team
关键信息
Google 表示,Gemini 3.5 Flash 主打在更低延迟和更低成本下提供前沿级智能,适合规划、构建、迭代和维护代码库等长周期智能体任务。此次汇总还提到 Gemini Omni 先从视频生成开始,支持图像、文本、视频和音频等参考输入,并加入 SynthID 水印,同时会在 Gemini、Flow 和 YouTube Shorts Remix 中推出。
资讯摘要
Google 在 I/O 2026 的总览中,把这次活动定位为一场涵盖 100 项发布的大型展示,涉及模型、智能体以及各类产品体验。最重要的开发者消息是 Gemini 3.5 Flash,Google 将其描述为最新系列中的首个模型,结合了前沿智能和行动能力。Google 表示,该模型已可通过 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio 正式使用。公司还称它进入了 Artificial Analysis 指数的右上象限,意味着在保持较高速度的同时仍具备很强的模型质量。Google 将它定位为适合长周期智能体任务的模型,例如应用开发、代码库维护,甚至财务文件准备。Google 还表示,Gemini 3.5 Flash 建立在 Gemini 3 的多模态基础之上,能够生成更丰富的交互式网页界面和图形。
与此同时,Google 提到 Gemini 3.5 Pro 已在内部使用,并计划在下个月推出。除了文本和代码,Google 还推出了 Gemini Omni,这是一款从任意输入生成任意内容的新模型,当前先从视频生成开始。Omni 把 Gemini 的智能与 Google 的生成式媒体模型结合起来,并加入了更好的物理规律理解,使画面更真实,同时还嵌入了不可感知的 SynthID 水印用于内容验证。Google 表示,Omni 可以引用图像、文本、视频或音频作为输入,且音频目前先支持语音引用。该模型将向 Google AI Plus、Pro 和 Ultra 订阅用户在 Gemini 应用和 Google Flow 中开放,同时也会免费提供给 18 岁及以上用户在 YouTube Shorts Remix 和 YouTube Create 中使用。Google 还强调,Omni 让视频创作和编辑变得更像对话式操作,例如可以通过简单提示实现电影感缩放或背景替换,而且在不同场景之间还能更好地保持角色一致性。

资讯正文
我们在 I/O 2026 上宣布的 100 件事
本周,在 Google I/O 2026 上,我们发布了新的模型、智能体和工具,帮助你进行构建、搜索、创作、发现、购物,并更高效地完成更多事情。你可以深入了解我们的 I/O 发布内容——其中包括 Google 首席执行官 Sundar Pichai 台上发言的经编辑文字稿。如果你想要一个(某种意义上的)TL;DR,请继续向下浏览我们每年一度的活动 100 项亮点清单。
使用我们最先进的模型进行创作与构建
Gemini 3.5
1. 我们推出了 Gemini 3.5 Flash:这是我们最新一代模型中的首个版本,结合了前沿智能与行动能力。
2. Gemini 3.5 Flash 现已通过我们的 agent-first 开发平台 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio 正式可用。
4. 在 Artificial Analysis 指数中位于右上象限的 3.5 Flash,以极快速度提供前沿级智能——这证明你不再需要在质量和延迟之间做取舍。
5. Gemini 3.5 Flash 非常适合处理长周期的 agentic 任务。过去可能需要开发者花上几天、或审计员花上几周才能完成的工作,如今 3.5 Flash 往往能以远低于一半的成本,在极短时间内帮助完成。它可以快速规划、构建并迭代,解决现实世界中的问题,无论是开发新应用、维护代码库,还是帮助准备财务文档。
6. 在 Gemini 3 强大的多模态基础之上,3.5 Flash 能生成更丰富、交互性更强的网页界面和图形。
7. 我们也在紧锣密鼓地开发 Gemini 3.5 Pro。它已经在内部使用,我们很期待下个月将其推出。
Gemini Omni
8. Gemini Omni 是我们的新模型,能够根据任何输入创建任何内容——从视频开始。它将 Gemini 的智能与我们最优秀的生成媒体模型相结合,带来全新的世界理解、多模态能力和编辑水平。我们现在先从视频输出开始,但随着时间推移,Gemini Omni 将能够从任何输入生成任何输出。
9. Gemini Omni 将对物理规律的直观理解与 Gemini 对历史、科学和文化的知识相结合,弥合了照片级真实感与有意义叙事之间的差距。它对重力、动能和流体动力学等力的理解有所提升,让你能够创建更逼真的场景。
10. 使用 Omni 创建的视频包含我们不可感知的 SynthID 数字水印。你可以通过 Gemini 应用、Chrome 中的 Gemini 和搜索轻松验证内容。
11. 你可以引用任何内容。Gemini Omni 会将任何参考素材——图像、文本、视频或音频——转化为一个统一、连贯的输出。虽然音频输入一开始只支持语音参考,但我们很快就会推出其他类型的音频输入支持。
Gemini 应用、Google Flow 和 YouTube 中的 Gemini Omni
12. Gemini Omni Flash 现已开始向全球所有 Google AI Plus、Pro 和 Ultra 订阅用户推出,可通过 Gemini 应用和 Google Flow 使用。它今天也已向 18 岁及以上用户免费开放,可在 YouTube Shorts Remix 和 YouTube Create 应用中使用。
13. 创建、重新混剪和编辑视频比以往任何时候都更容易。Gemini 应用中的 Gemini Omni 提供了一种流畅、对话式的视频创作和编辑方式——比如只需一个简单提示,就能应用电影感变焦或更换背景。
14. 你可以上传相机胶卷中的任何照片或视频,一键应用内置模板,无需昂贵设备或技术术语,就能体验这种魔力。你甚至可以通过创建一个看起来和声音都像你的自定义 AI 头像,把自己置身于动作之中。
15. 对于使用 Google Flow 的创作者来说,Omni Flash 让你能够将现实世界的灵感与生成内容融合,并以对话方式反复迭代。Gemini Omni Flash 还提升了角色一致性,这意味着身份和声音会在每一个场景中保持不变。
16. 你还可以在 YouTube Shorts Remix 中免费试用全新的 Gemini Omni 模型,并体验一个令人兴奋的新升级,让你可以直接走进自己最喜欢的 Shorts。只需选择一个符合条件的 Short,提示你想要更改的内容——比如加入你自己或任何视觉参考——然后就能得到一个带有你编辑的新版本。
搜索、购物并准确发现你正在寻找的内容
AI 搜索
17. AI Mode 是我们最强大的 AI 搜索,月活跃用户已超过 10 亿。今天,我们正在全球范围内将其体验升级为以 Gemini 3.5 Flash 作为新的默认模型。
18. 我们看到令人难以置信的增长势头,自上线以来,AI Mode 查询量每个季度都翻了一倍多。而在上个季度,我们看到 Search 查询量创下历史新高。
19. 今天,我们将推出 25 年来对 Search 搜索框最大的一次升级——一个全新的、智能的搜索框,如今已完全借助 AI 重新构想。你可以使用文本、图像、文件、视频和 Chrome 标签页进行搜索,并在它们之间进行推理。你仍将继续获得来自 Search 的多种结果,就像今天一样。
20. 我们也在让继续与 Search 对话变得更加容易,把 AI Overviews 和 AI Mode 合并为一种无缝的 AI 搜索体验。你可以自如地从问题出发,进入带有 AI Overview 的搜索结果页,再转到 AI Mode 中的后续提问,所有过程都附带可进一步了解的链接。新的无缝 AI 搜索体验现已在全球桌面端和移动端上线。
信息代理
21. 我们正进入搜索代理时代,在这里,你可以直接在 Search 中轻松创建、定制和管理多个 AI 代理,来处理你的众多任务。我们首先推出的是信息代理,它们会在后台 24/7 运行,让你能够持续了解任何对你重要的话题、任务或项目的最新动态。
22. 你的代理会智能地查看网络上的一切内容,比如博客、新闻网站和社交帖子,以及我们最新鲜的数据,例如实时的金融、购物和体育信息,来监测与你特定问题相关的变化。然后,你的代理会向你发送一份智能整合的更新,还具备采取行动的能力。你可以在 Search 中同时启动多个信息代理,随时获取更新,并推动所有对你重要的事情不断向前。
23. 你将能够在今年夏天开始让信息智能体为你工作,并首先向 Google AI Pro 和 Ultra 订阅用户开放。
Search 中的生成式 UI 和 Antigravity
24. 借助 Google Antigravity 的能力以及 Gemini 3.5 Flash 的智能体式编码能力,Search 可以为你的问题即时构建完全定制的理想格式。
25. 你可以获得定制的生成式 UI,由 Search 设计自定义布局,并实时组装组件——例如交互式可视化、表格、图表或模拟——帮助你更好地理解复杂主题。结合 Antigravity 的生成式 UI 将于今年夏天向所有人免费在 Search 中推出。
26. 有些项目并不是一次性的提问——它们是持续性的任务,比如规划婚礼或管理搬家。对于这些场景,Search 可以更进一步——帮助你构建完整的自定义体验,例如仪表盘或跟踪器,让你可以持续回来查看。你可以把它们想成用于你特定任务的迷你应用。
27. 未来几个月内,你将能够在 Search 中直接借助 Antigravity 构建类似迷你应用的自定义体验,首先面向订阅用户。
个人智能
28. 我们正在将 AI Mode 中的个人智能扩展给更多人,覆盖近 200 个国家和地区、98 种语言——无需订阅。
29. 在 Search 的 AI Mode 中,你可以安全地连接 Gmail 和 Google Photos 等应用,Google Calendar 也即将支持。个人智能从设计之初就将透明度、选择权和控制权放在核心位置。你始终掌握控制权——你可以决定是否以及何时连接 Gmail 和 Google Photos 等应用。
通用购物车
30. 我们正在推出 Universal Cart:一个真正智能的购物车,也是你在 Google 上购物的新中心。无论你是在 Search 中浏览、与 Gemini 聊天、观看 YouTube,甚至是在阅读 Gmail 时,都可以把商品加入购物车。你加入商品的那一刻,购物车就会在后台开始为你工作。它会寻找优惠和降价,提供价格历史洞察,并在商品补货时向你提醒。
31. Universal Cart 基于我们的 Gemini 模型运行,因此随着模型不断改进,你的购物车也会变得更聪明。
32. 它还使用智能推理来预判你的需求,并在问题出现之前帮助解决。它会主动标记任何商品不兼容情况,并建议替代方案。由于这款购物车建立在 Google Wallet 之上,它能理解你的支付方式优惠、会员信息和商家优惠,因此可以智能地帮助你在不同支付方式之间做出选择。
33. Universal Commerce Protocol(UCP)让你从购物车结账变得非常顺畅。对于许多你喜爱的品牌,你只需借助 Google Pay 在 Google 上轻点几下即可结账,或者将商品直接转到零售商网站并在那里购买。
34. 我们将于今年夏天在 Search 和 Gemini 应用中推出 Universal Cart,随后还会扩展到 YouTube 和 Gmail。
用 Gemini 应用简化你的一天
Gemini Spark
35. Gemini Spark 是你 24/7 的个人 AI 代理,帮助你导航数字生活,代表你采取行动,并始终在你的指挥之下。即使你的手机或笔记本电脑处于关闭状态,它也会在后台运行。
36. Spark 运行在 Gemini 3.5 之上,并构建于 Google Antigravity 平台。它会在你的指挥下自主运作。你可以选择开启它,而且它的设计初衷是在代表你采取重大行动之前先与你确认。
37. Gemini Spark 还处于产品旅程的非常早期阶段,我们在首个版本中优先考虑安全性——这就是为什么我们先向可信测试者推出,并计划在下周将 Beta 版带给美国的 Google AI Ultra 订阅用户。
38. 接下来,我们为 Google Spark 制定了内容丰富的路线图,相关功能将在整个夏季持续发布。例如:你将能够直接通过短信或电子邮件联系 Spark,创建自定义子代理,甚至在授权支付时指定预算和商家。
Daily Brief
39. Daily Brief 是我们全新的开箱即用型代理,它会根据你的目标整理并优先安排你接下来的一天,并提出下一步建议。
40. 借助 Daily Brief,Gemini 会在夜间为你工作,收集你第二天需要的信息。它会分析你的收件箱、日历和任务,找出对你来说最重要的事项。它简洁而有洞见,能够串联起你生活中的各个信息点。它还具有可执行性,会预判你的需求并提出下一步建议。而且它会随着时间不断学习,记住你的偏好、日期和时间。
41. Daily Brief 从今天开始向所有 Google AI 订阅用户(18+)在 Gemini 应用中逐步推出,首发地区为美国。要使用 Daily Brief,Google AI 订阅用户必须已经选择连接他们的 Google 应用。
Neural Expressive
42. 我们从底层彻底重新设计了 Gemini 体验。从你打开应用或访问网站的那一刻起,你就会看到一种我们称之为 Neural Expressive 的全新设计语言,其中贯穿流畅动画、鲜活色彩、新字体和触觉反馈。
43. 我们简化并精炼了一切,统一了工具菜单,也让发现和生成精美的图片、视频和音乐变得更容易,并内置了可让你立即重新混搭的模板。
44. 当你发送提示词的那一刻,Neural Expressive 便真正焕发生机。你不会再看到一大段文字墙。相反,Gemini 会实时为你精心排版展示回复。随着你滚动页面,你可能会看到可以放大查看、并从全新层面探索信息的交互式图片,或者可以快速浏览的时间线,或嵌入式视觉内容。
45. 我们也彻底重塑了 Gemini Live 体验——它现在会立即以内联方式打开。Gemini Live 还在使用一个更聪明、更快、且不那么受背景噪音干扰的新模型。
46. 很快,你甚至可以选择一种与你产生共鸣的地区方言。我们将在未来几周内逐步推出这些功能。
用代理提升你的构建
Google Antigravity
47. Google Antigravity 是我们的 agent-first 开发平台,任何人都可以借此成为构建者。今天,Antigravity 正在大幅扩展其 agentic 能力套件、展示界面、集成和产品功能。
48. Google Antigravity 2.0 是一款新的独立桌面应用,作为代理交互的中央主页。你可以编排多个 agent 并行执行任务,例如让一个 agent 编写网站代码,而另一个生成品牌素材。
49. Antigravity CLI 面向那些更喜欢留在终端中的用户。它是一个轻量、高速的产品界面,让你无需图形用户界面即可立即创建新的 agent。
50. Antigravity SDK 让你可以以程序化方式访问同样支撑 Google 产品的 agent harness,而这套 harness 是针对我们的 Gemini 模型协同优化的。这个 SDK 让你能够自定义 agent 行为,并将它们托管在你自己的基础设施上。
51. 我们还将为 Gemini 音频模型推出原生语音支持,同时也会集成到许多界面和平台中,例如 Android、Firebase 和 Google AI Studio。
52. 全新的 Antigravity 毫不掩饰地以 agent 为中心,聚焦于核心的 agent 对话、agent 生成的产物以及多 agent 编排。Antigravity agent harness 是 Gemini 执行现实世界任务的无形框架,如今已经强大得多,新增了 subagents、hooks 和异步任务管理等核心原语。支撑这一切的是 Gemini 模型,其中 Gemini 3.5 Flash 已与 Antigravity agent harness 进行了协同优化。
53. 原本需要持续数天的工程工作,如今被压缩到了数小时,甚至几分钟。这得益于新的 subagent 协作能力。我们正以早期研究预览版的形式在 Antigravity 中向你提供这一功能。
54. 我们正在统一采用 Antigravity 作为 agent-first 开发所需的唯一平台。我们把从你如何使用 Gemini CLI 中学到的经验,整合进了 Antigravity CLI。我们鼓励用户迁移到 Antigravity CLI,并已发布指南,帮助你迁移自定义技能。现在你将获得与 Antigravity 2.0 相同的 harness,以及在所有界面上统一的 agentic 体验。
55. 对于企业客户,我们允许将 Google Antigravity 直接连接到你的 Google Cloud 项目,并适用你所预期的同样企业条款。对于现有的 Gemini Enterprise 客户,你很快就会在未来几个月看到 Antigravity 的陆续推出。
Google AI Studio
56. 即将推出的新 Google AI Studio 应用,让你可以在外出途中捕捉一个想法,并在回到办公桌前时就获得一个可用的原型。
57. 现在可以直接从你在 AI Studio 中构建的应用访问 Google Workspace。借助这一集成,你可以基于 Sheets 数据构建仪表盘,创建用于整理用户 Drive 的工具,或者快速搭建能处理团队已经在日常使用的文档和数据的应用,而且全程无需离开 AI Studio。
58. 从今天开始,你现在可以直接在 build 标签页中构建原生 Android 应用。只需选择“Build an Android app”并开始提示即可。
59. 我们还在 AI Studio 中为开发者加入了对 Google Play Console 的支持,方便直接将应用发布到测试轨道。你可以在浏览器中运行的 Android Emulator 上预览应用,也可以使用 Android Debug Bridge(ADB)把应用安装到 Android 测试设备上。你还可以在 AI Studio 中连接你的 Google Play 开发者账号,只需单击一下即可将你的 Android 应用发布到 Google Play 的 Internal Test Track。
60. 刚开始使用 AI Studio 的开发者现在可以免费将他们的前两个应用部署到 Google Cloud,无需信用卡。
61. 如果你想进行本地开发以加快迭代,现在可以直接导出到 Google Antigravity。你的对话历史、项目文件和密钥都会一并带走,这样你就能精准接着上次停下的地方继续,吸纳更大的团队,并开始扩展你的开发工作流。
62. 在 AI Studio 中,你现在拥有更多自定义选项来设计应用的外观和体验。AI Studio Build agent 可以使用 Nano Banana 自动即时生成自定义图片。这有助于你构建定制化界面,或为专门的使用场景制作原型,而无需外部占位素材。我们新的编辑工具允许你直接在预览窗口中做标注。你可以在应用上涂画、调整组件并生成新的视觉元素,在整个流程中即时迭代你的构建。
Managed Agents
63. 我们正在 Gemini API 中推出 Managed Agents。借助 Managed Agents,只需一次 API 调用即可向 Antigravity agent 预配一个远程 Linux 环境,在该环境中,agent 可以通过 harness 进行推理、规划并调用工具;在隔离的沙箱中执行代码并管理文件;还可以浏览网页以获取和处理实时数据。Managed Agents 由新的 Antigravity agent 提供支持,该 agent 基于 Gemini 3.5 Flash 构建,并可通过 Interactions API 以及 Google AI Studio 使用。
64. 你可以用自己的指令和技能扩展 Antigravity agent。你无需编写复杂的编排代码,而是可以在 AGENTS.md 和 SKILL.md 这类 markdown 文件中定义全部内容,并将它们注册为一个命名 agent。
65. 我们宣布推出 Build with Gemini XPRIZE Hackathon,这是一项新的全球竞赛,总奖金池为 200 万美元——这是黑客松历史上最大的一次。我们邀请开发者使用 Gemini 构建真实应用,解决世界上一些最紧迫的挑战。
Subscriptions
66. 我们推出了全新的 100 美元 AI Ultra 套餐,专为开发者、技术负责人、知识工作者和高级创作者量身打造。它在 Gemini app 和 Antigravity 中的使用额度是 AI Pro 套餐的 5 倍,还包含 20TB 云存储和更多功能,帮助你加速开发周期,并将前沿智能带入你的工作流。
67. 购买版 Google AI Pro 订阅现在还会包含 YouTube Premium Lite 个人计划,无需额外费用。该权益每月增加 8.99 美元价值,让你可以无广告、离线以及在后台观看大多数 YouTube 和 YouTube Kids 视频,获得更好的娱乐体验。
在工作中做更多事情,并提升你的创造力
AI Inbox
68. 今年早些时候,我们推出了 AI Inbox,作为 Gmail 中的一个全新视图,它能智能地突出显示最重要的内容。它可以帮助你优先处理待办事项,并提供关于重要事项的更新。目前,它已面向 Google AI Ultra 订阅用户开放,我们也开始向美国所有 Google AI Plus 和 Pro 订阅用户陆续推出。
69. AI Inbox 现在会基于上下文信息生成个性化的草拟回复,这样你就可以在几秒钟内审阅并回复。
70. 从现在起,在 AI Inbox 中,如果某项任务需要查看 Google Doc、Sheet 或 Slide,相关链接会直接显示在待办事项旁边。
71. 我们还宣布了更多简化 AI Inbox 中任务管理的方式。你可以通过单独标记某项任务已完成、忽略无帮助的建议,或者一键将某个主题下的所有邮件标记为已读,来保持视图整洁。
72. 从今年夏天开始,Google AI Pro 和 Ultra 订阅用户将能够通过 Gmail Live 与收件箱对话——无需在邮件线程中费力翻找,就能提出具体查询。
Google Pics
73. 我们推出了 Google Pics,这是一款全新的图像创建和编辑工具,基于我们最新的 Nano Banana 模型打造,帮助你几乎创造任何东西——从派对传单到信息图表,都能按照你想要的创意控制来完成。无论你是在空白画布上从头设计,还是编辑现有照片,Pics 都能帮你省去复杂图像生成的麻烦。这款新工具包含对象分割等功能(因此你可以精确选择并编辑特定元素)、文字编辑与翻译,以及与 Workspace 的集成。
74. Google Pics 今天已向一小批受信任的测试用户推出。今年夏天,它将向全球 Google AI Pro 和 Ultra 订阅用户开放,并向 Google Workspace 企业客户提供预览版。
Docs Live 和 Talk to Keep
75. Docs Live 是一项新功能,允许你通过语音创建文档并进行编辑。只要开口说话,Docs Live 就会处理繁重工作——整理你的想法、构建文档结构,并在你允许的情况下,从你的 Gmail、Drive、Chat 和网络中提取相关细节。Google AI Pro 和 Ultra 订阅用户将可于今年夏天开始通过语音与 Docs 对话。
76. 你很快就可以用 Keep 来“倾倒脑内想法”了。Keep 不仅能理解你的碎碎念,还会在后台开始工作,以你说话的速度把你的思绪流转化为有条理的笔记和清单。这项功能将于今年夏天面向 Google AI Pro 和 Ultra 订阅用户推出,并向 Google Workspace 企业客户提供预览版。
Google Flow
77. 在去年的 I/O 舞台上,我们推出了 Google Flow。此后,我们将 Flow 扩展为一个 AI 创意工作室,新增了视频和图像生成及编辑能力,并已在全球 140 多个国家/地区上线。Gemini Omni Flash 现已在全球范围内向 Google AI 订阅用户提供于 Google Flow 中使用。
78. 对于使用 Google Flow 的创作者来说,Gemini Omni Flash 让你能够将现实世界的灵感与生成内容结合起来,并通过对话式方式反复迭代。Gemini Omni Flash 还提升了角色一致性,这意味着身份和声音可以在每一个场景中得以保留。
79. 我们还在推出 Google Flow Agent。在此之前,Flow 一次只能执行一个提示。现在,你的 agent 可以承担多步骤任务。Google Flow 中的 agent 是你的创意伙伴,能够在你的输入和你的掌控下,规划并推理复杂任务。
80. Google Flow Agent 基于 Gemini 模型构建,结合专业能力和对你项目的深入理解,可在早期头脑风暴、创作和编辑阶段提供帮助。例如,这个 agent 可以就特定场景中的角色对话充当讨论对象,甚至提出剧情建议。当你深入推进项目时,agent 可以一次生成多个变体,为你提供更多选择,甚至批量编辑,让你的调整同步反映到所有素材中。一旦你拥有了素材,agent 还能将它们整理成集合,甚至可以直观地为它们重新命名。Google Flow Agent 现已面向全球所有 Google Flow 用户开放。
81. 我们还在推出 Google Flow Tools。现在,你可以直接在 Google Flow 中用 vibe coding 创建任何你能想到的创意工具,由你为自己的独特创作流程量身打造——比如设计视频特效、手绘动画或叠加文字。
82. 你可以使用自然语言在 Google Flow 中创建定制工具和工作流。无论你是在寻找特定的图片编辑器、视频缩放器还是自定义着色器,现在都可以轻松开发,无需编程经验。如果你做出了觉得别人也会喜欢的东西,还可以轻松与其他 Flow 用户分享,他们可以将其 remix 成自己的版本。全球所有 Google Flow 用户都可以使用现有的 Tools,而 Google AI 订阅用户还可以创建和 remix 它们。
Google Flow Music、Pomelli 和 Stitch
83. 借助 Google Flow Music,你现在还可以使用 Gemini Omni 与 agent 进行对话式协作,来指导可分享的音乐视频。新的细化功能让你能够以更高的粒度编辑歌曲的特定部分。例如,你可以把某一段歌词改成另一种语言,改变流派,调整乐器编排,或对几乎任何你能想到的其他内容进行微调。
84. Pomelli 正在增加构建品牌内容和设计网站的新方式。
85. 借助实时设计和引导,使用 Stitch 进行设计现在变得更加自然、直观,也更像协作。你现在可以通过文字描述你想要的内容,或者直接说出来,Stitch 会与你并肩工作,把你的想法逐步构建并重新排版。你还可以导入现有代码库和设计文件,确保你的作品符合品牌风格。
推动科学突破与发现
86. 我们推出了 Gemini for Science,这是一个新的科学工具与实验集合,旨在在研究过程的每个阶段扩展科学探索的规模和精度。它包括 Google Labs 上三个新的实验性工具,可简化日常科学任务,无论是跟进新发表的论文、将研究目标转化为可用代码,还是生成新的假设。这些工具包括:
87. Hypothesis Generation 由 Co-Scientist 构建,模拟科学方法。它会与研究人员协作定义研究难题,然后使用多智能体“创意锦标赛”来生成、辩论并评估假设。为确保绝对严谨,所有主张都经过深入验证,并附有可点击引用作为支持。
88. Computational Discovery 是一款代理式研究引擎,由 AlphaEvolve 和 Empirical Research Assistance(ERA)构建,可并行生成并评分数千种代码变体。这使科学家能够测试新的建模方法——用于太阳能预测或流行病学等复杂领域——而这些方法如果靠人工探索,可能需要数月时间。
89. 还有 Literature Insights,由 NotebookLM 构建,它会搜索科学文献,并将结果结构化为带有自定义、可搜索属性的表格,便于并排分析。研究人员可以通过聊天发掘建立在其精选语料库之上的细微差别,并创建高保真成果,例如报告、幻灯片、信息图以及音频和视频概览。
90. 从 5 月 19 日起,我们将逐步开放这三款实验性工具的访问权限。用户可以访问 labs.google/science 注册兴趣。
91. 作为 Gemini for Science 的一部分,我们还推出了 Science Skills,这是一个专用工具包,整合了来自 30 多个主要生命科学数据库和工具的洞见,包括 UniProt、AlphaFold Database、AlphaGenome API 和 InterPro。借助这些技能,在像 Google Antigravity 这样的 agent-first 代理式平台上,研究人员可以在几分钟而非几小时内完成结构生物信息学和基因组分析等复杂且往往需要人工操作的工作流。Science Skills 将于 5 月 19 日起在 Github 上提供,并面向所有 Google Antigravity 用户开放。
92. 我们还与 ICML、STOC 和 NeurIPS 等领先科学会议合作,创建了专门试点,用于开发面向代理式同行评审和科学验证的开创性工具,例如我们的实验性 Paper Assistant Tool(PAT)和 ScholarPeer。
改变你学习和探索的方式
Ask YouTube
93. 我们正在通过新的对话式搜索体验 Ask YouTube,重新构想用户搜索和发现感兴趣内容的方式。借助 Ask YouTube,你可以提出更复杂的搜索问题,例如想要了解如何教孩子骑自行车的小贴士。Ask YouTube 将从整个 YouTube 目录中汇总最相关的视频——包括长视频和 Shorts——并提供交互式、结构化的回应。
94. Ask YouTube 将于本月开始在美国面向以英语搜索的一小部分桌面端用户以实验形式逐步推出。
Android XR
95. Android XR 的下一个重大里程碑是智能眼镜。智能眼镜将有两种类型:一种是音频眼镜,可在耳中提供语音帮助;另一种是显示眼镜,可在你需要信息时立刻显示所需内容。
96. 我们的首批音频眼镜由 Gentle Monster、Warby Parker 和 Samsung 合作打造,将于今年秋季上市,并兼容 Android 和 iOS 设备。
SynthID
97. 三年前,我们推出了 SynthID,这项业界领先的水印技术可将不可察觉的信号嵌入 AI 生成内容中。我们的目标是让人们更容易了解自己在网上看到的内容。因此,我们最近在 Gemini 应用中加入了针对图片、视频和音频的 SynthID 验证功能。到目前为止,这项功能在全球已被使用了 5000 万次,我们今天也正在把这一验证能力扩展到 Search,并将在未来几周内扩展到 Chrome。
98. 你可以通过 Search 中的 Lens、AI Mode 和 Circle to Search 等功能,以及 Chrome 中的 Gemini 来了解一张图片的来源。只需询问:“This made with AI?”或者“Is this AI generated?”
99. 我们还将为 C2PA Content Credentials 增加验证功能,以便轻松检查内容是否是来自相机的未修改原始版本,或者是否经过编辑,以及使用了哪些工具。该功能今天起将首先在 Gemini 应用中推出,并将在未来几个月内登陆 Search 和 Chrome。
100. 由于数字媒体会在多个平台之间传播,行业范围内的合作以及采用稳健、可互操作工具至关重要。随着 OpenAI、Kakao 和 ElevenLabs 等公司将 SynthID 技术引入更多 AI 生成内容,互联网上将有更多内容很快带上这种不可察觉的水印。
来源与参考
收录于 2026-05-21