元鉴
返回中文阅读流

Google DeepMind Blog

使用 Nano Banana Pro(我们的 Gemini 3 Pro Image 模型)进行构建

来自 Google DeepMind Blog 的最新公开更新。

中文内容

已翻译official company source英文原文2025-11-20

使用 Nano Banana Pro(我们的 Gemini 3 Pro Image 模型)进行构建

开发者可以这样使用 Nano Banana Pro(Gemini 3 Pro Image):这是一款功能强大的新型图像生成与编辑模型,具备高级功能和创意控制能力。

Alisa Fortin
正文:Alisa Fortin
产品经理,Google DeepMind
正文:Naina Raisinghani
产品经理,Google DeepMind
Image with multiple input-output images with the text Build with Nano Banana Pro in the center

今天,我们发布 Nano Banana Pro(Gemini 3 Pro Image),这是一个基于 Gemini 3 Pro 构建的更高保真度模型,可供开发者获取工作室级图像生成能力。就在几个月前,我们发布了 Nano Banana(Gemini 2.5 Flash Image)。此后,我们很高兴看到社区将其关键功能投入使用——从角色一致性到照片修复,甚至利用其能力在无限画布中进行局部编辑。

这款先进的图像生成与编辑模型开始以付费预览形式推出,供企业通过 Google AI Studio 和 Vertex AI 中的 Gemini API 构建新一代智能多模态应用。该模型能够生成高保真图像,在文本渲染方面准确性更高,并具备强大的世界知识;同时,模型可通过 Google Search 进行 grounding,根据用户提示检索数据,从而进一步增强能力。

Gemini 3 Pro Image 在文本到图像 AI 基准测试中表现出色。

Gemini 3 Pro Image Text to Image AI benchmark bar chart compared to other leading competitors

我们还在整个开发者生态系统中扩大 Gemini 3 Pro Image 的覆盖范围。在 Google Antigravity——我们的新型智能体开发平台——中,编码智能体现在可以直接利用这些图像生成能力,生成详细的 UI 模型供用户审阅,甚至在代码实现之前生成新的视觉素材。此外,Adobe 和 Figma 等领先创意平台也正在集成该模型。

高保真度与控制能力

如果你正在构建需要精确性的高级工具,Gemini 3 Pro Image 可让你控制图像的物理属性(光照、相机、焦点、色彩分级)和构图,以确保输出达到专业质量。

一个迷失在金色散景与晨雾之海中的剪影。

提示词:将体积光替换为散景

Image showing a side by side of an input image of the silhouette of a man with scattered sun rays and an output image where the same image with more volumetric lighting using AI

凭借可用的 2K 和 4K 分辨率,你可以确保输出满足专业制作所需的分辨率标准。通过组合产品图像、徽标和参考图等多种元素,轻松创建风格统一的广告。可实现最多五个人物的一致相似度,整合六张高保真镜头,或将多达十四个标准输入融合为一则精致广告。试用我们的演示应用,它可让你将徽标与产品配对,创建自己的模型设计。

通过参考图让产品设计生动呈现的演示应用。序列已缩短。

改进的文本渲染与本地化

Gemini 3 Pro Image 相比 2.5 Flash Image 实现了显著跃升,将抽象图像生成转化为功能性资产。它擅长处理逻辑和语言,并提供先进的文本渲染能力,可在图像中生成清晰、准确且融合自然的文字。

创意美食摄影:每个单词都用与该食物相关的真实食材进行艺术化拼写。

提示词:制作 8 个精致的极简主义徽标,每个都是一个有趣的食物词,并用逼真的食物组成字母来表达该词的含义。构图:将所有徽标渲染在单一纯白背景上

Image showing the words Mint, soup, taco, curry, sushi, pasta, apple and pizza rendered using food items with AI

它也是开发营销素材、教育内容及众多其他应用的理想解决方案。你可以在 Google AI Studio 的漫画书生成器应用中试用该模型的能力,创作以你和一位朋友为主角的原创多页漫画书,并配备高级文本渲染与风格化效果。

演示应用:根据照片和所选类型,用你选择的语言创建一本漫画书。序列已缩短。

借助 Gemini 3 Pro Image,我们消除了图像生成与本地化逻辑之间的障碍。这个高级模型能够理解图像的语义上下文,从而利用图像到图像生成,轻松更改菜单、标牌或文档等元素上的语言,同时保留原有艺术风格或版式。

一个饮料营销活动概念,展示将英文文本准确翻译并渲染为法语。

提示词:翻译成法语

Side by side of an input image of a set of cans with text and output image with text on can translated in French using AI

获取世界知识

Gemini 3 Pro Image 连接庞大的知识库,相较以往图像生成模型可生成更具事实性的资产。此外,在启用后,使用 Google Search 进行 grounding 可将模型连接到实时网页内容,以实现数据驱动的输出。这对于需要精确呈现的应用尤其有价值,例如生物学图示或历史地图。你可以通过我们的演示应用亲自尝试,动态创建面向特定受众的任意主题信息图。

由一个可创建教育信息图的演示应用生成的自行车保养与维护信息图。

An infographic for bike care and maintenance essentials built with a simple text prompt using AI

尽情发挥,今天就开始构建

此次新模型发布纳入了你们已经与我们分享的许多反馈,但我们不会止步于此。为确保 AI 生成媒体具有清晰来源,我们已将 SynthID 数字水印直接集成到每一张由 Gemini 3 Pro Image 创建或编辑的图像中,以标明其 AI 生成或编辑来源。

你可以从探索我们使用 Gemini 3 Pro Image 的应用集合开始,激发想象力并了解可能实现的内容。获得灵感后,你可以改编这些演示应用,或通过 Google AI Studio 中的 Gemini API 以及面向企业使用的 Vertex AI,将该模型直接集成到自己的项目中。在此过程中,如需技术细节,请查看文档、提示词指南、cookbook,或访问开发者论坛以获取帮助并分享反馈。

使用 Gemini 2.5 Flash Image 可实现更快、成本更低的图像生成;使用 3 Pro Image 可实现质量更高的图像生成,但成本和延迟也更高。

A table showing comparison between Gemini 2 Pro Image and Gemini 2.5 Flash Image models across speed, quality and cost
发布于:
  • 开发者工具
  • AI 产品
  • Gemini 模型

原文标题

Build with Nano Banana Pro, our Gemini 3 Pro Image model