中文内容
已翻译official company source英文原文2025-10-24
August 5, 2025 Models
Genie 3:世界模型的新前沿
Jack Parker-Holder 与 Shlomi Fruchter
给定文本提示后,Genie 3 能够生成动态世界,支持以每秒 24 帧的帧率实时漫游,并在 720p 分辨率下保持数分钟的一致性。
迈向世界模拟
在 Google DeepMind,我们已在模拟环境领域开展了十余年的开创性研究,涵盖了从训练智能体精通即时战略游戏,到开发用于开放式学习与机器人研究的模拟环境。这项工作推动了我们对世界模型的开发。世界模型是一种人工智能系统,能够利用其对现实世界的理解来模拟其中的特定方面,从而使智能体能够预测环境的演变过程,以及自身行动将产生的影响。
世界模型也是通往 AGI 道路上的关键基石,因为它们使得 AI 智能体能够在丰富的模拟环境中接受无限多样化的训练。去年,我们发布了首批基础世界模型 Genie 1 和 Genie 2,它们能够为智能体生成全新的环境。此外,凭借 Veo 2 和 Veo 3 模型,我们持续推动视频生成技术迈向新的高度,这些模型展现出了对直观物理规律的深刻理解。
这些模型在世界模拟的不同能力维度上均取得了进展。Genie 3 是我们首个支持实时交互的世界模型,且相较于 Genie 2,在一致性与真实感方面均有提升。




- 能力
- 具身智能体研究
- 局限性
- 责任
- 后续步骤
Genie 3 的功能包括:
以下是 Genie 3 实时交互的记录。
对世界物理属性的建模
体验水与光照等自然现象,以及复杂的环境交互。
Slide 1 of 5










模拟自然世界
生成充满生机的生态系统,涵盖从动物行为到错综复杂的植物生命。
Slide 1 of 4








动画建模与虚构创作
激发想象力,创造奇幻场景与富有表现力的动画角色。
原文标题
Genie 3: A new frontier for world models