元鉴
返回中文阅读流

Google AI Blog

我们如何使用 Gemini 打造 Google I/O 2026

了解 Google 员工如何使用 AI 制作 Google I/O 2026。

中文内容

已翻译official company source英文原文2026-06-01

我们如何使用 Gemini 打造 Google I/O 2026

2026年6月1日

·

从水母暖场秀到我们的“TPU Training Day”影片,看看 Gemini 如何帮助实现今年的 I/O。

A collage of I/O-related images, including the Antigravity Coffee Co. pop-up, a colorful jellyfish and a still from the Timmy TPU video. The word AI repeats three times on the left of the image, and there are colorful icons, including a spa

您的浏览器不支持音频元素。

Listen to article
此内容由 Google AI 生成。生成式 AI 仍处于实验阶段
[[duration]] 分钟
语音 速度
语音
速度 正文:0.75X 正文:1X 正文:1.5X 正文:2X

Google I/O 2026 的主题是我们如何以新的方式让 AI 对每个人都有帮助。但我们并不只是在 I/O 上发布关于 AI 创新的公告——我们也使用这些工具让 I/O 生动呈现。

现在是一个既奇特又令人兴奋的创造时刻。我们正经历一场不可思议的变革,AI 工具每个月都在变得更好,实际上正在改写我们能够创造什么的规则。

今年,我们挑战自己,使用我们在舞台上展示的同一套 AI,让自己在创新、创作和效率上超越以往。

我们的行动比以往任何时候都更快,并进行实时原型设计——将人类艺术创造力与实验性技术相融合——其中最好的例子莫过于“Timmy TPU”影片。

但其回报在于展示这些工具如何释放创造力并接管琐碎任务,让团队把最高效的时间重新投入到最适合他们完成的工作上。如果运用得当,活动本身就会令人惊叹;作为观众,你会不再去想 AI 是如何被使用的。这种转变正是我们想要分享的机会,因为人们一直在问:“你到底能用 AI 做什么?”

继续阅读,了解我们使用了哪些 AI 工具,以及我们如何提示它们,来帮助打造 I/O 2026。

AI x 电影

“TPU Training Day”短片

AI 产品与模型:Google AI Studio;实验性 DeepMind 模型;Gemini Omni;Nano Banana

我们做了什么:我们制作了一部短片,主角是一群 TPU,它们正准备为 I/O 2026 承担一些繁重的任务。

我们如何做到的:这个项目始于一个问题:我们能否用最简单的材料——纸板和马克笔——制作一部动画电影,然后用 AI 让它活起来?我们与导演 Laurie Rowan 和 Nexus Studios 合作,将木偶、传统动画和 AI 融合在一起,同时让人类工艺与艺术性始终处于《TPU Training Day》(也称为“Timmy TPU”)的核心。

首先,我们通过木偶表演和简单的 3D 动画来捕捉角色表演。这让我们能够完全控制构图和镜头运动。随后,我们使用 Nano Banana 从这些原始素材中生成风格化的首帧。为了保持帧的一致性,我们在 Google AI Studio 内部构建了一个自定义工具。这使我们能够大规模测试 Nano Banana 帧,在生成序列之前确保像素级精准匹配。

我们使用 Gemini Omni 和其他实验性模型,将基础动画与风格化帧融合在一起。这将影片提升到了电影级水准,同时保留了原本的人类创作意图。保留这些细微的人为不完美,正是赋予木偶电影魅力的关键,而我们的 AI 流程正是为了保护这些细节而设计的。

AI x 视觉设计

I/O 视觉品牌识别

The words I/O surrounded by related icons, all in rainbow colors, against a white background

AI 产品与模型:Gemini models 和 Nano Banana

我们做了什么:我们为 I/O 2026 创建了视觉品牌识别,最终采用了带有重叠透明效果和互锁图标的四色渐变。

我们是如何做到的:我们的品牌识别是我们团队与 AI 密切协作的成果。我们首先向 Gemini 模型输入了以往的品牌指南和五年来的 I/O 回顾。早期输出并未完全达到预期,因此我们进行了一些微实验。我们生成了新的图像,并根据反馈将输出迭代地回传给 Nano Banana。我们还使用 Nano Banana 探索图标风格。最终,我们确定了扁平 2D 图标,这些图标可动态转变为具有丰富纹理的 3D 图标。这在主题演讲、实体标识和数字应用中形成了一致的品牌表达。

以下是我们用来通过 Nano Banana 探索图标风格的一条提示词:

我们的 I/O YouTube 预告片展示了我们最终的图标风格:

AI × 沉浸式体验

I/O 会前秀:Jellectronica

AI 产品与模型:Google Antigravity;Google Colab;Google CoralNPU;Google Flow Music;Lyria 3 Pro

我们所做的:我们以 Jellectronica 拉开了会前秀的序幕。这是与 Monterey Bay Aquarium 合作开展的一项生成式音乐实验,使用 Lyria 3 Pro 将海月水母的运动转化为声音。

我们是如何做到的:我们在 Google Colab 中训练了一个 YOLO8 模型,然后在 Google 的 Coral NPU 上运行它。该模型追踪水母的运动来控制音乐,而音乐则使用 Google Flow Music 和 Lyria API 制作。例如,低音区域中的水母越多,低音就越响亮、越有活力。我们还在 Google Antigravity 中通过 vibe coding 编写了一个批量分轨生成器,用于自动生成低音、和弦、旋律和鼓等音乐分轨。

I/O 预演:Infinite Scaler 和 Code the Countdown

AI 产品与模型:Google AI Studio;Gemini API;Gemini Canvas;Google Antigravity;Lyria 3;Nano Banana

我们做了什么:Infinite Scaler 是预演的另一个环节,这是一款视频游戏,玩家在游戏过程中进行竞争并生成关卡。

我们是这样实现的:我们希望玩家只需使用 2D 图像生成,就能快速构建无限的 3D 世界。为此,我们通过 Gemini API 使用 Nano Banana,根据用户提示词和参考图像生成精灵图表。我们将前景元素再发送回 Nano Banana,以生成法线、粗糙度和自发光贴图。这会推断出深度,让我们能够在将纹理加入全局世界堆栈之前,把纹理映射到 WebGL 渲染的 3D 纸板盒上。我们先使用 Google AI Studio 进行快速原型设计,随后转到 Google Antigravity 进行开发;游戏内音乐完全使用 Lyria 3 生成。

你可以在这里游玩这款游戏,并探索我们共同构建的关卡。

以下是 Infinite Scaler 的一个用户提示词示例:

将其反馈到 Gemini API 以生成关卡方案后,我们得到了这个提示词:

该提示生成了这张精灵图表。该游戏的精灵图表将多个元素组合在一个一致的模板中,并使用绿幕背景以便轻松进行遮罩处理。

Sprite sheet showing various images including a fox and Saturn against a lime green background

这一过程生成了一个像这样的完全可玩的 3D 关卡:

最后,我们播放了一个由全球创作者在我们的 Code the Countdown 挑战中编写代码生成的倒计时。我们邀请你在 Canvas 或 AI Studio 中设计 1 到 10 之间的数字,然后将它们拼接成一个由代码驱动的倒计时。

Antigravity Coffee Co. 快闪店

Antigravity Coffee Co. pop-up at I/O
Intricate latte art of a bicycle at Antigravity Coffee Co.

AI 产品与模型:Flutter;Gemini Enterprise Agent Platform;Google Antigravity;Nano Banana

我们做了什么:我们为 I/O 参会者创建了一款应用,让他们可以设计并订购带有自定义拉花图案的拿铁,然后构建属于自己的、史上最失控咖啡应用版本。

我们如何做到:我们使用生成式 UI 和 A2UI 协议,并结合 Flutter 构建能够实时变化的自适应界面。这用动态用户交互取代了静态表单。Firebase 将前端与 Nano Banana 等模型连接起来。这处理了复杂推理和内容生成。单一 Flutter 代码库在不同硬件上提供了高质量、零延迟的体验。我们依托 Google Cloud 和 Firebase,包括 Cloud Functions、Firestore 和 Cloud Ops。这解决了构建和监控现代生成式 AI 应用的复杂性。参会者还使用 Google Antigravity 的代理式编码功能,快速构建自己的点单应用。

AI x 创意惊喜

演讲者标题卡

AI 产品与模型:Gemini Omni;Google Flow;Nano Banana Pro

我们做了什么:每位演讲者都获得了使用我们的图像和视频生成模型制作的专属定制生成标题卡。

我们如何做到的:Josh Woodward——我们的 Google Labs 与 Google Gemini 副总裁——就是一个很好的例子。在舞台上,与会者看到一个数字版 Josh 骑着 Chrome Dino,随后扣篮。

我们使用 Nano Banana Pro 生成核心素材,例如角色要素参考表。我们用这些要素制作故事板,尝试不同变体并加入个人细节。在 Google Flow 中,我们首先使用 Veo 帮助制作动作原型,并生成诸如扣篮之类的动画。我们还在 Google Flow 中使用 Gemini Omni 生成动画,这在处理复杂的体育动作时尤其有帮助。详细的文本提示词使 AI 输出与我们的参考表保持一致。最后,我们将生成视频中的原始动作进行合成和时间重映射,制作成精美的片头。

以下是我们用于角色要素参考表的一条提示词:

以下是我们随后使用的一条 Google Flow 视频提示词:

贴纸周边

Four 3D I/O stickers in different patterns, including a black and purple galactic pattern

AI 产品与模型:Gemini 和 Nano Banana

我们做了什么:我们现场为与会者生成并打印了定制 I/O 贴纸。

我们是如何做的:我们在一个定制 Web 应用上构建了一个互动贴纸游戏。玩家有 20 秒时间,使用一个 Android 机器人接住下落的提示词。提示词类别超过 100 个——从蓝莓、迪斯科球到激光和木材。玩家选择两个提示词,或者点击“I'm feeling lucky”进行随机混合。我们的后端——使用面向 Gemini 和 Android 的 Nano Banana——将这些选择融合在一起。这生成了高度个性化的定制 I/O 贴纸设计。可以想象一个由纯金华夫饼制成的 3D “I/O”,或是一块软糖熊主板。设计会立即打印出来,供与会者领取。

以下是我们用于生成贴纸设计的一个示例提示词,开头是一些通用指南:

接下来,我们提供了有关颜色、光照等单个元素的更多细节,并在下面的示例中展示了标志性的“I/O”形状:

原文标题

How we used Gemini to build Google I/O 2026