元鉴
返回中文阅读流

Google AI Blog

回顾 I/O 2026 的 12 个重要时刻

以下是 Google I/O 2026 主题演讲中 12 个最重要的时刻,包括关于 Gemini Omni、Gemini 3.5 Flash 等的消息。

中文内容

已翻译official company source英文原文2026-05-28

回顾 I/O 2026 的 12 个重要时刻

2026年5月28日

·

重温我们今年在舞台上的一些精彩时刻,包括最新模型的首次亮相、Search 更新等。

The colorful I/O logo against a black background, surrounded by stills from the I/O keynote

您的浏览器不支持音频元素。

Listen to article
此内容由 Google AI 生成。生成式 AI 仍处于实验阶段
[[duration]] 分钟
语音 速度
语音
速度 正文:0.75X 正文:1X 正文:1.5X 正文:2X

我们最大胆、最重磅的新进展在 Google I/O 2026 上成为焦点。我们宣布了多项技术突破,例如 Gemini Omni 能够从任何输入创建任何内容,首先从视频开始。我们还分享了旨在帮助你日常使用的产品更新,例如全新的智能 Search 框,它将允许你跨模态搜索,以文本、图片、文件、视频或 Chrome 标签页作为输入。(此外,还有大量其他重要的 I/O 公告,更多精彩内容不止于此!)

如果你错过了,以下是今年 I/O 主题演讲中一些最令人兴奋的发布内容。

正文:1. Gemini Omni

Gemini Omni 是我们的新模型,能够从任何输入创建任何内容——首先从视频开始。借助 Omni,你可以将图片、音频、视频和文本组合为输入,并生成基于 Gemini 现实世界知识的高质量视频。你还可以通过对话轻松编辑你的视频。

首先,我们将推出 Omni 系列的首个模型:Gemini Omni Flash。Gemini Omni Flash 正通过 Gemini 应用和 Google Flow 面向全球所有 Google AI Plus、Pro 和 Ultra 订阅用户推出。它也正通过 YouTube Shorts 和 YouTube Create App 免费面向用户推出。

正文:2. Gemini 3.5 Flash

我们全新的 Gemini 3.5 模型家族将前沿智能与行动能力相结合。我们将以发布 Gemini 3.5 Flash 作为该系列的开端,它为智能体和编码提供前沿性能,尤其擅长能够带来现实效用的复杂长期任务。

Gemini 3.5 Flash 已通过 Google Antigravity、Google AI Studio 和 Android Studio 中的 Gemini API、Gemini Enterprise Agent Platform 以及 Gemini Enterprise 正式提供。它也已在搜索中的 AI Mode 面向所有人开放,并且现在正通过 Gemini 应用向全球所有人推出。我们也在努力开发 Gemini 3.5 Pro。它已经在内部使用,我们期待下个月推出。

3. 搜索中的信息代理

我们正在进入搜索代理的时代,你可以直接在搜索中轻松创建、自定义和管理多个 AI 代理,用于处理你的众多任务。我们将从信息代理开始,它们会在后台 24/7 全天候运行,智能地跨网络进行推理,涵盖博客、新闻网站和社交帖子等内容(以及我们最新的数据,例如金融、购物和体育方面的实时信息)。信息代理将帮助你随时了解对你最重要的任何事项,在恰到好处的时刻发送一份全面更新,内容正是你所需要的,并附上有用链接,供你在网上进一步探索。

信息代理将于今年夏季开始推出,首先面向 Google AI Pro 和 Ultra 订阅用户。只需在搜索中添加“keep me updated”即可创建一个信息代理,并通过搜索中 AI Mode 的侧边面板查看你的活跃代理。

4. 搜索中由 Google Antigravity 提供支持的体验

我们将把 Antigravity 以及 Gemini 3.5 Flash 的代理式编码能力直接引入 Search,因此 Search 可以完全根据你的问题,为你即时构建最理想的格式,完全定制。你可以获得动态布局、交互式视觉内容以及完整体验,全部专为你创建。这些生成式 UI 能力将于今年夏天在 Search 中面向所有人免费推出。

有些项目并不是一次性问题——而是持续性的任务。同样借助 Antigravity,Search 还将为你编码完整的定制体验,例如工具、仪表盘或跟踪器。这就像用 Search 构建你自己的迷你应用。它们尤其适合那些你希望反复回来处理的长期任务,例如筹备婚礼或管理搬家事宜。未来几个月,你将能够直接在 Search 中使用 Antigravity 构建定制体验,首先面向美国的 Google AI Pro 和 Ultra 订阅用户推出。

5. 每日简报

Gemini 应用中的 Daily Brief 是一个新的智能体,可为你提供个性化的晨间简报,并整理你开启一天所需了解的确切信息。这份个性化摘要旨在成为你每天早晨的第一站。选择启用后,Gemini 会在后台跨你已连接的应用运行。它会从你的 Gmail 收件箱中收集紧急更新,从你的 Calendar 中跟踪即将发生的活动,并将相关的后续细节汇编成一份便于快速浏览的简报。它远不止是简单的摘要。Daily Brief 会根据你的具体目标主动组织信息并确定优先级,甚至会建议下一步可立即采取的行动。随着时间推移,你可以通过对回复快速点赞或点踩,轻松引导它。

Daily Brief 正在 Gemini 应用中面向所有 Google AI 订阅者(18 岁及以上)推出,首先在美国上线。要使用 Daily Brief,Google AI 订阅者必须已选择连接他们的 Google 应用。

正文:6. Universal Cart

我们新的 Universal Cart 是一款真正智能的购物车,也是你在 Google 上购物的新枢纽。它可跨商家和服务运行,因此你可以在浏览 Search、与 Gemini 聊天、观看 YouTube,甚至阅读 Gmail 时,将商品加入购物车。你添加商品的那一刻,购物车就会在后台为你开始工作。它会查找优惠和降价信息,为你提供价格历史洞察,并在商品恢复有货时提醒你。

Universal Cart 将于今年夏天在美国的 Search 和 Gemini 应用中推出,随后将登陆 YouTube 和 Gmail。

正文:7. Neural Expressive

我们以 Neural Expressive 从头开始彻底重新设计了 Gemini 体验。这是我们令人惊艳的全新设计语言,从你打开 Gemini 应用或访问网站的那一刻起就能看到。界面采用流畅动画、鲜明色彩、全新字体,并贯穿触觉反馈。模型回应是 Neural Expressive 真正鲜活起来的地方。Gemini 不再呈现一堵文字墙,而是实时设计量身定制的回应——融合丰富图像、交互式时间线、旁白视频和动态图形。

Neural Expressive 现已面向所有人在 Android、iOS 和网页端的 Gemini 应用中推出。

正文:8. Gemini Spark

Gemini 应用中的这款 24/7 个人 AI 智能体可帮助你管理数字生活,在你的指示下代表你执行操作。它与 Google 的一系列工具集成,例如 Gmail、Docs、Slides 等;由于它是基于云端的智能体,即使你合上笔记本电脑或锁定手机,它也能在后台继续工作。借助 Spark,你可以设置定期任务,教它新技能,并创建完整的工作流。是否启用它以及它连接哪些应用由你决定;它的设计是在执行高风险操作(例如花钱或发送电子邮件)之前先征求你的同意。

Gemini Spark 正在向受信任的测试人员推出,我们也将其作为 Beta 版面向美国的 Google AI Ultra 订阅用户推出。

9. macOS 版 Gemini 应用

我们正在为 macOS 版 Gemini 应用开发重大更新。今年夏天,我们将把 Gemini Spark 引入 Gemini 桌面应用,使其能够协助处理涉及本地文件的任务,并在整个桌面上自动化工作流程。

我们还在 macOS 应用中创新打造新的语音体验,类似于我们在 The Android Show 上预览的内容。你不必担心在边思考边说话时出现的各种“嗯”或“那……呢”。借助屏幕上的上下文,Gemini 可以将你自由表达的语音转化为精准的草稿,并在光标所在位置即时重新格式化文本,以捕捉你的意图。

所有用户均可下载 macOS 应用,Gemini Spark 和新的语音功能将于今年夏天晚些时候推出。

10. 智能眼镜

我们在 Android XR 上的下一个重要里程碑是智能眼镜。智能眼镜将分为两类:音频眼镜可在你耳边提供语音帮助,显示眼镜则会在你需要时即时呈现所需信息。

音频眼镜将于今年晚些时候的秋季推出,在 I/O 2026 上,我们公布了首批两款设计。这些眼镜让你无需动手、无需低头即可完成各种事情,比如听音乐、拍照、打电话、下你常点的咖啡订单,或在不用把手伸进口袋的情况下使用手机应用。

正文:11. SynthID

三年前,我们推出了 SynthID,这是我们业界领先的数字水印技术,可将不可感知的信号嵌入 AI 生成内容中。此后,我们已将 SynthID 集成到我们的生成式媒体模型和产品中,为超过 1000 亿张图像和视频以及 60000 年的音频资产添加水印,并将 SynthID 验证功能引入 Gemini 应用。未来几周,我们将把这项验证能力扩展到 Search,并扩展到 Chrome。

OpenAI、Kakao 和 ElevenLabs 等公司正在采用 SynthID,为更多自己的 AI 生成内容添加水印。我们还在 Google Cloud 的 Gemini Enterprise Agent Platform 上推出一款新的 AI 内容检测 API,为企业提供一种强大的工具,用于在其运营中识别合成媒体。

此外,我们正在将 Content Credentials 扩展到更多产品。Pixel 10 是首款在其原生相机应用中为图像提供 Content Credentials 的智能手机,未来几周我们将把这项技术扩展到 Pixel 8、9 和 10 手机上的视频。我们还将在 Gemini 应用中加入 Content Credentials 验证,并在未来几个月将其加入 Search 和 Chrome。这将向你显示内容的来源是 AI 还是相机,以及它是否经过生成式 AI 工具编辑。

正文:12. Gemini for Science

Gemini for Science 是一套新的科学工具和实验集合,旨在扩大科学探索的规模并提升其精度。它基于 Gemini 以及 Deep Think 和 Deep Research 的深度推理与研究能力,包括 Labs 上的新实验,以及用于将 Google Antigravity 等智能体平台连接到 30 多个主要生命科学数据库和工具的 Science Skills。

你可以在 Google Labs 上表达对试用 Gemini for Science 实验的兴趣,Science Skills 现已在 GitHub 上以及 Google Antigravity 中直接提供。

原文标题

Catch up on 12 major I/O 2026 moments