元鉴
返回中文阅读流

Google DeepMind Blog

Genie 3:世界模型的新前沿

Genie 3 可生成动态世界,支持实时导航,帧率 24fps,在 720p 分辨率下保持几分钟的一致性。

中文内容

已翻译official company source英文原文2025-10-24
August 5, 2025 Models

Genie 3:世界模型的新前沿

Jack Parker-Holder 与 Shlomi Fruchter

给定文本提示后,Genie 3 能够生成动态世界,支持以每秒 24 帧的帧率实时漫游,并在 720p 分辨率下保持数分钟的一致性。

迈向世界模拟

在 Google DeepMind,我们已在模拟环境领域开展了十余年的开创性研究,涵盖了从训练智能体精通即时战略游戏,到开发用于开放式学习与机器人研究的模拟环境。这项工作推动了我们对世界模型的开发。世界模型是一种人工智能系统,能够利用其对现实世界的理解来模拟其中的特定方面,从而使智能体能够预测环境的演变过程,以及自身行动将产生的影响。

世界模型也是通往 AGI 道路上的关键基石,因为它们使得 AI 智能体能够在丰富的模拟环境中接受无限多样化的训练。去年,我们发布了首批基础世界模型 Genie 1 和 Genie 2,它们能够为智能体生成全新的环境。此外,凭借 Veo 2 和 Veo 3 模型,我们持续推动视频生成技术迈向新的高度,这些模型展现出了对直观物理规律的深刻理解。

这些模型在世界模拟的不同能力维度上均取得了进展。Genie 3 是我们首个支持实时交互的世界模型,且相较于 Genie 2,在一致性与真实感方面均有提升。

Comparison table detailing the advancements of the Genie 3 model over GameNGen, Genie 2, and Veo in key areas like control, resolution, and interaction latency.
Your browser does not support the video tag. Your browser does not support the video tag.
Genie 3 能够在更长的时间跨度内生成一致且可交互的世界
Your browser does not support the video tag. Your browser does not support the video tag.
  • 能力
  • 具身智能体研究
  • 局限性
  • 责任
  • 后续步骤

Genie 3 的功能包括:

以下是 Genie 3 实时交互的记录。

对世界物理属性的建模

体验水与光照等自然现象,以及复杂的环境交互。

Slide 1 of 5
Your browser does not support the video tag. Your browser does not support the video tag.
提示词:视频以第一人称视角展示了在火山地带中部穿越艰难地形的过程。这是一段真实世界视频,由需穿越地形的轮式机器人视角拍摄。该载具配备了粗大的越野轮胎,在焦黑的岩石上碾压时发出碎裂声。摄像头为安装在车体上的第一人称视角镜头,画面底部可见前轮及机器人车身。远处可见火山冒出的烟雾与流淌的熔岩。视野中不见其他生命迹象。画面中分布着智能体试图避开的熔岩池与不规则的岩石构造。天空呈现出鲜艳的蔚蓝色。
Your browser does not support the video tag. Your browser does not support the video tag.
提示词:灯光节期间的水上摩托
Your browser does not support the video tag. Your browser does not support the video tag.
提示词:在佛罗里达州的人行道上行走,道路一侧为双向车道,另一侧为海洋。飓风正逼近,狂风大作,海浪不断漫过路面。主体左侧有一道栏杆,将其与大海隔开。道路沿海岸线延伸,主体前方可见一座短桥。海浪接连不断地翻越栏杆,拍打在路面上。棕榈树在狂风中剧烈弯曲。暴雨倾盆,主体身着雨衣。现实世界,第一人称视角。
Your browser does not support the video tag. Your browser does not support the video tag.
提示词:快速跟拍的真实世界视频,跟随一只水母在深海幽暗中高速游动,穿梭于峡谷之间,峡谷表面覆盖着密集的热泉贻贝,上面爬满微小的白蟹。远处模糊的热液喷口从微亮的岩石构造中喷吐出浓密翻腾、呈亮蓝色的富含矿物质烟柱。环境极暗,深海光线昏暗,微粒在浑浊的海水中漂浮。
Your browser does not support the video tag. Your browser does not support the video tag.
提示词:直升机飞行员正小心翼翼地操控飞机,飞越一处带有小瀑布的海岸悬崖。

模拟自然世界

生成充满生机的生态系统,涵盖从动物行为到错综复杂的植物生命。

Slide 1 of 4
Your browser does not support the video tag. Your browser does not support the video tag.
提示词:沿着冰川湖的湖岸奔跑,在森林中探索分岔的小径,穿越潺潺的高山溪流。置身于美丽的雪山与松林之间。丰富的野生动物让这段旅程充满乐趣。
Your browser does not support the video tag. Your browser does not support the video tag.
提示词:写实风格的跟拍镜头,在幽暗的深海中穿梭,游经深邃的海底峡谷;庞大的水母群密集游弋,辅以生物荧光效果。
Your browser does not support the video tag. Your browser does not support the video tag.
提示词:这是一处模拟自然实景的日式禅意花园。场景设定于清晨,天空晴朗。柔和温暖的阳光洒满庭院,投下修长而柔和的阴影。地面铺满细腻的白沙,被精心耙出细致的漩涡状纹路。园中设有一方静谧的池塘,水面漂浮着粉色的睡莲。大小不一、表面光滑的灰石错落分布于园内,部分石面附着青苔。主要景观包括一座叠石景观与一盏传统日式石灯笼。整个区域在背景处由高耸的竹篱笆围合。视觉风格追求照片级写实,白沙、岩石与繁茂绿植的纹理细节呈现极高精度。
Your browser does not support the video tag. Your browser does not support the video tag.
提示词:环境为自然真实的户外景观,具体表现为茂密繁盛、生机勃勃的植被群落。叶片宽大且纹理深邃,呈现出从翠绿到青柠绿的丰富绿色层次,其间点缀着些许黄色与红色,暗示着一个丰饶健康的生态系统。抽象的斑驳光线自上而下滤过,在叶片上形成不断变幻的光影图案,凸显出其错综复杂的叶脉与多样的表面质感。整体氛围宁静且极具沉浸感,唤起置身于生机盎然、充满活力的自然世界之感。部分叶片表面可见细小的水珠,反射着环境光。背景为同类植被的柔和虚化效果,以突出前景元素。空气显得湿润而静谧。

动画建模与虚构创作

激发想象力,创造奇幻场景与富有表现力的动画角色。

原文标题

Genie 3: A new frontier for world models