返回中文阅读流

Google DeepMind Blog

Genie 3：世界模型的新前沿

Genie 3 可生成动态世界，支持实时导航，帧率 24fps，在 720p 分辨率下保持几分钟的一致性。

中文内容

已翻译official company source英文原文2025-10-24

August 5, 2025 Models

Genie 3：世界模型的新前沿

Jack Parker-Holder 与 Shlomi Fruchter

Try Project Genie

给定文本提示后，Genie 3 能够生成动态世界，支持以每秒 24 帧的帧率实时漫游，并在 720p 分辨率下保持数分钟的一致性。

迈向世界模拟

在 Google DeepMind，我们已在模拟环境领域开展了十余年的开创性研究，涵盖了从训练智能体精通即时战略游戏，到开发用于开放式学习与机器人研究的模拟环境。这项工作推动了我们对世界模型的开发。世界模型是一种人工智能系统，能够利用其对现实世界的理解来模拟其中的特定方面，从而使智能体能够预测环境的演变过程，以及自身行动将产生的影响。

世界模型也是通往 AGI 道路上的关键基石，因为它们使得 AI 智能体能够在丰富的模拟环境中接受无限多样化的训练。去年，我们发布了首批基础世界模型 Genie 1 和 Genie 2，它们能够为智能体生成全新的环境。此外，凭借 Veo 2 和 Veo 3 模型，我们持续推动视频生成技术迈向新的高度，这些模型展现出了对直观物理规律的深刻理解。

这些模型在世界模拟的不同能力维度上均取得了进展。Genie 3 是我们首个支持实时交互的世界模型，且相较于 Genie 2，在一致性与真实感方面均有提升。

Comparison table detailing the advancements of the Genie 3 model over GameNGen, Genie 2, and Veo in key areas like control, resolution, and interaction latency.

Genie 3 能够在更长的时间跨度内生成一致且可交互的世界

Genie 3 能够在更长的时间跨度内生成一致且可交互的世界

能力
具身智能体研究
局限性
责任
后续步骤

Genie 3 的功能包括：

以下是 Genie 3 实时交互的记录。

对世界物理属性的建模

体验水与光照等自然现象，以及复杂的环境交互。

Slide 1 of 5

提示词：视频以第一人称视角展示了在火山地带中部穿越艰难地形的过程。这是一段真实世界视频，由需穿越地形的轮式机器人视角拍摄。该载具配备了粗大的越野轮胎，在焦黑的岩石上碾压时发出碎裂声。摄像头为安装在车体上的第一人称视角镜头，画面底部可见前轮及机器人车身。远处可见火山冒出的烟雾与流淌的熔岩。视野中不见其他生命迹象。画面中分布着智能体试图避开的熔岩池与不规则的岩石构造。天空呈现出鲜艳的蔚蓝色。

提示词：视频以第一人称视角展示了在火山地带中部穿越艰难地形的过程。这是一段真实世界视频，由需穿越地形的轮式机器人视角拍摄。该载具配备了粗大的越野轮胎，在焦黑的岩石上碾压时发出碎裂声。摄像头为安装在车体上的第一人称视角镜头，画面底部可见前轮及机器人车身。远处可见火山冒出的烟雾与流淌的熔岩。视野中不见其他生命迹象。画面中分布着智能体试图避开的熔岩池与不规则的岩石构造。天空呈现出鲜艳的蔚蓝色。

提示词：灯光节期间的水上摩托

提示词：灯光节期间的水上摩托

提示词：在佛罗里达州的人行道上行走，道路一侧为双向车道，另一侧为海洋。飓风正逼近，狂风大作，海浪不断漫过路面。主体左侧有一道栏杆，将其与大海隔开。道路沿海岸线延伸，主体前方可见一座短桥。海浪接连不断地翻越栏杆，拍打在路面上。棕榈树在狂风中剧烈弯曲。暴雨倾盆，主体身着雨衣。现实世界，第一人称视角。

提示词：在佛罗里达州的人行道上行走，道路一侧为双向车道，另一侧为海洋。飓风正逼近，狂风大作，海浪不断漫过路面。主体左侧有一道栏杆，将其与大海隔开。道路沿海岸线延伸，主体前方可见一座短桥。海浪接连不断地翻越栏杆，拍打在路面上。棕榈树在狂风中剧烈弯曲。暴雨倾盆，主体身着雨衣。现实世界，第一人称视角。

提示词：快速跟拍的真实世界视频，跟随一只水母在深海幽暗中高速游动，穿梭于峡谷之间，峡谷表面覆盖着密集的热泉贻贝，上面爬满微小的白蟹。远处模糊的热液喷口从微亮的岩石构造中喷吐出浓密翻腾、呈亮蓝色的富含矿物质烟柱。环境极暗，深海光线昏暗，微粒在浑浊的海水中漂浮。

提示词：快速跟拍的真实世界视频，跟随一只水母在深海幽暗中高速游动，穿梭于峡谷之间，峡谷表面覆盖着密集的热泉贻贝，上面爬满微小的白蟹。远处模糊的热液喷口从微亮的岩石构造中喷吐出浓密翻腾、呈亮蓝色的富含矿物质烟柱。环境极暗，深海光线昏暗，微粒在浑浊的海水中漂浮。

提示词：直升机飞行员正小心翼翼地操控飞机，飞越一处带有小瀑布的海岸悬崖。

提示词：直升机飞行员正小心翼翼地操控飞机，飞越一处带有小瀑布的海岸悬崖。

模拟自然世界

生成充满生机的生态系统，涵盖从动物行为到错综复杂的植物生命。

Slide 1 of 4

提示词：沿着冰川湖的湖岸奔跑，在森林中探索分岔的小径，穿越潺潺的高山溪流。置身于美丽的雪山与松林之间。丰富的野生动物让这段旅程充满乐趣。

提示词：沿着冰川湖的湖岸奔跑，在森林中探索分岔的小径，穿越潺潺的高山溪流。置身于美丽的雪山与松林之间。丰富的野生动物让这段旅程充满乐趣。

提示词：写实风格的跟拍镜头，在幽暗的深海中穿梭，游经深邃的海底峡谷；庞大的水母群密集游弋，辅以生物荧光效果。

提示词：写实风格的跟拍镜头，在幽暗的深海中穿梭，游经深邃的海底峡谷；庞大的水母群密集游弋，辅以生物荧光效果。

提示词：这是一处模拟自然实景的日式禅意花园。场景设定于清晨，天空晴朗。柔和温暖的阳光洒满庭院，投下修长而柔和的阴影。地面铺满细腻的白沙，被精心耙出细致的漩涡状纹路。园中设有一方静谧的池塘，水面漂浮着粉色的睡莲。大小不一、表面光滑的灰石错落分布于园内，部分石面附着青苔。主要景观包括一座叠石景观与一盏传统日式石灯笼。整个区域在背景处由高耸的竹篱笆围合。视觉风格追求照片级写实，白沙、岩石与繁茂绿植的纹理细节呈现极高精度。

提示词：这是一处模拟自然实景的日式禅意花园。场景设定于清晨，天空晴朗。柔和温暖的阳光洒满庭院，投下修长而柔和的阴影。地面铺满细腻的白沙，被精心耙出细致的漩涡状纹路。园中设有一方静谧的池塘，水面漂浮着粉色的睡莲。大小不一、表面光滑的灰石错落分布于园内，部分石面附着青苔。主要景观包括一座叠石景观与一盏传统日式石灯笼。整个区域在背景处由高耸的竹篱笆围合。视觉风格追求照片级写实，白沙、岩石与繁茂绿植的纹理细节呈现极高精度。

提示词：环境为自然真实的户外景观，具体表现为茂密繁盛、生机勃勃的植被群落。叶片宽大且纹理深邃，呈现出从翠绿到青柠绿的丰富绿色层次，其间点缀着些许黄色与红色，暗示着一个丰饶健康的生态系统。抽象的斑驳光线自上而下滤过，在叶片上形成不断变幻的光影图案，凸显出其错综复杂的叶脉与多样的表面质感。整体氛围宁静且极具沉浸感，唤起置身于生机盎然、充满活力的自然世界之感。部分叶片表面可见细小的水珠，反射着环境光。背景为同类植被的柔和虚化效果，以突出前景元素。空气显得湿润而静谧。

提示词：环境为自然真实的户外景观，具体表现为茂密繁盛、生机勃勃的植被群落。叶片宽大且纹理深邃，呈现出从翠绿到青柠绿的丰富绿色层次，其间点缀着些许黄色与红色，暗示着一个丰饶健康的生态系统。抽象的斑驳光线自上而下滤过，在叶片上形成不断变幻的光影图案，凸显出其错综复杂的叶脉与多样的表面质感。整体氛围宁静且极具沉浸感，唤起置身于生机盎然、充满活力的自然世界之感。部分叶片表面可见细小的水珠，反射着环境光。背景为同类植被的柔和虚化效果，以突出前景元素。空气显得湿润而静谧。

动画建模与虚构创作

激发想象力，创造奇幻场景与富有表现力的动画角色。

原文标题

Genie 3: A new frontier for world models