中文内容
推出 Nano Banana Pro
2025年11月20日
·以前所未有的控制力、改进的文本渲染和增强的世界知识,将你的愿景转化为工作室级设计。
总体概述
Google DeepMind 推出 Nano Banana Pro,这是一款基于 Gemini 3 Pro 构建的新型图像生成与编辑模型。你可以用它创建准确的视觉内容,并在多种语言中呈现清晰可读的文本。即日起可在 Gemini 应用、Google Ads 和 Google AI Studio 等 Google 产品中试用 Nano Banana Pro。
Summaries were generated by Google AI. Generative AI is experimental.要点
《Introducing Nano Banana Pro》主要介绍 Google 全新的先进图像生成与编辑模型。Nano Banana Pro 可帮助你轻松可视化想法、创建信息图,并将笔记转化为图表。生成包含多语言准确文本的图像,非常适合用于模型图、海报和国际化内容。通过一致的品牌呈现、先进的创意控制以及最高 4K 分辨率,创建高保真视觉内容。你可以在 Gemini、Google Ads、Workspace 等产品中试用 Nano Banana Pro,并通过 SynthID 水印提升透明度。
Summaries were generated by Google AI. Generative AI is experimental.探索其他风格:
- 一般摘要
- 要点
就在几个月前,我们发布了 Nano Banana,即我们的 Gemini 2.5 Flash Image 模型。从修复老照片到生成迷你手办,Nano Banana 是图像编辑领域的一大进步,让普通创作者能够表达自己的创造力。
今天,我们推出 Nano Banana Pro(Gemini 3 Pro Image),这是我们全新的最先进图像生成与编辑模型。Nano Banana Pro 基于 Gemini 3 Pro 构建,利用 Gemini 最先进的推理能力和现实世界知识,以前所未有的方式更好地可视化信息。
Nano Banana Pro 如何帮助你将任何想法或设计变为现实
Nano Banana Pro 可以帮助你可视化任何想法并设计任何内容——从原型,到将数据呈现为信息图,再到把手写笔记转换成图表。
借助 Nano Banana Pro,现在你可以:
基于增强的推理能力、世界知识和实时信息,生成更准确、上下文更丰富的视觉内容
凭借 Gemini 3 的高级推理能力,Nano Banana Pro 不仅能创作精美图像,还能帮助你创作更有用的内容。你可以获得准确的教育类讲解内容,帮助你进一步了解一个新主题,例如基于你提供的内容或来自现实世界的事实生成上下文丰富的信息图和图表。Nano Banana Pro 还可以连接到 Google Search 庞大的知识库,帮助你快速生成某个食谱的概览,或可视化天气、体育等实时信息。
一张关于常见室内植物 String of Turtles 的信息图,包含其起源、养护要点和生长模式等信息。
提示:创建一张关于这种植物的信息图,重点展示有趣的信息。
制作 Elaichi Chai(豆蔻茶)的分步信息图,展示将食谱和现实世界信息可视化的能力。
提示:创建一张展示如何制作 elaichi chai 的信息图。
我们使用 Nano Banana Pro 通过 Search grounding 获取实时天气,以构建一张波普艺术风格的信息图。
使用多种语言,直接在图像中生成更准确、清晰可读文本的更优质视觉内容
Nano Banana Pro 是直接在图像中创建正确渲染且清晰可读文本的最佳模型,无论你需要的是一句简短标语,还是一段长段落。Gemini 3 擅长理解深度和细微差别,这为图像编辑和生成开启了无限可能——尤其是在文本方面。现在,你可以在模型稿或海报中创建更细致的文本,并使用更多样的纹理、字体和书法风格。借助 Gemini 增强的多语言推理能力,你可以生成多种语言的文本,或对内容进行本地化和翻译,从而实现国际化扩展,和/或更轻松地与亲友分享内容。
一张黑白分镜草图,展示了一个电影场景的远景、 中景、特写和主观镜头。
提示:为这个场景创建一个分镜
“BERLIN”一词融入城市街区的建筑之中,横跨多栋建筑。
提示词:在一个阳光明媚的日子里,柏林一条舒适街道的景象,阴影鲜明。老房子的形状奇特,像是拼出“BERLIN”的字母。颜色为蓝色、红色、白色和黑色。房子仍然看起来像房子,与字母的相似之处很微妙。
受含义启发的书法,展示了用更丰富的纹理和字体生成富有表现力文本的能力。
提示词:制作 8 个极简主义标志,每个都是一个富有表现力的单词,并让字母以视觉方式传达信息或声音,以戏剧化的方式表达这个词的含义。构图:在单一白色背景上,以黑色呈现所有标志的平面矢量渲染
一个饮品广告活动概念,展示了将英文文本准确翻译并渲染为韩文的效果。
提示词:将三个黄蓝色罐子上的所有英文文本翻译成韩文,同时保持其他所有内容不变。
一款平面设计,呈现带有复古丝网印刷质感的“TYPOGRAPHY”一词。
提示词:在带纹理的米白色背景上呈现一个鲜艳、吸睛的“TYPOGRAPHY”设计。字母粗体、块状、超窄,通过亮蓝色和艳粉色的重叠图层营造出 3D 效果,每层都有半色调网点图案,唤起复古印刷美学。16:9 宽高比
通过将短语融入劈柴场景,以富有创意的方式融合文字与纹理。
提示词:创建一张图像,展示短语“How much wood would a woodchuck chuck if a woodchuck could chuck wood”,该短语由一只土拨鼠抛出的木头组成。
借助升级的创意能力,创建高保真视觉效果
- 设计即一致:借助 Nano Banana Pro,你可以融合比以往更多的元素,最多使用 14 张图像,并保持最多 5 个人物的一致性和相似度。无论是将草图转化为产品,还是将蓝图转化为逼真的 3D 结构,你现在都可以弥合概念与创作之间的差距。轻松将你想要的视觉外观和感受应用到模型中,确保你的品牌在每一个接触点都保持无缝且一致。
在复杂构图中保持多达 14 个输入(包括多个角色)的一致性。
提示词:一个中景镜头,14 个毛茸茸的角色紧紧挤在一起,并排坐在一张磨旧的米色布艺沙发上以及地板上。它们都面朝前方,看着摆放在沙发前一张低矮木桌上的一台复古木箱电视机。房间光线昏暗,左侧窗户透进暖光,电视的光辉照亮了这些生物的脸庞和毛茸茸的质感。背景是一个温馨、略显杂乱的客厅,有一块编织地毯、一个摆满旧书的书架,以及背景中的乡村风厨房元素。整体氛围温暖、舒适且充满趣味。
通过组合多个元素来打造生活方式场景。
提示词:将这些图像组合成一张布局恰当的 16:9 电影感图像,并把人体模型上的连衣裙换成图像中的连衣裙
通过组合多个输入元素来创建超现实景观。
提示词:将这些图像合成为一张布局恰当的 16:9 格式电影感图像
一张以沙漠景观为背景的高端时尚大片,保持 6 张输入照片中人物的一致性和相似度。
提示词:把这五个人和这只狗放进一张图像中,它们应当融入一张令人惊艳、获奖级别的时尚大片风格照片中。所有五个人的身份及其服装,以及这只狗,都必须始终保持一致,但可以、也应该从不同角度和距离呈现,以最自然且最适合该场景的方式呈现。让他们所有人的色彩和光照看起来自然,使他们看起来像是自然融入这场时装秀。
- 工作室级创意控制:借助 Nano Banana Pro 的新功能,我们将高级创意控制直接交到你手中。通过改进的局部编辑,选择、优化并变换图像的任意部分。调整相机角度、改变焦点并应用精细的色彩分级,甚至改变场景光照(例如将白天改为夜晚或创建散景效果)。得益于多种可用的宽高比以及可用的 2K 和 4K 分辨率,你的创作可适配从社交媒体到印刷品的任何平台。
通过调整宽高比,改变图像的外观和观感,以适配一系列平台。
提示词:通过减少背景将宽高比改为 1:1。角色保持在当前位置完全锁定不变。
应用光照和焦点控制,将场景从白天转换为夜晚。
提示词:将这个场景变成夜晚
通过光照控制遮暗或照亮图像的某一部分,以实现特定的戏剧性效果。
提示词:生成一张具有强烈明暗对比效果的图像。男子应保留其原有的特征和表情。引入强烈的定向光,看起来从上方略偏左的位置照射而来,在脸上投下深而清晰的阴影。只有几缕光线照亮他的眼睛和颧骨,脸部其余部分处于深重阴影中。
通过调整景深或焦点(例如,聚焦在花朵上)来凸显构图的细节。
提示:聚焦于花朵
今天你可以如何试用 Nano Banana Pro
在我们的各类产品和服务中,你现在可以选择:用于快速、有趣编辑的原版 Nano Banana,或用于需要最高质量和视觉上精致效果的复杂构图的 Nano Banana Pro。
- 消费者和学生:当你在 Gemini app 中选择带有“Thinking”模型的“Create images”时,该功能正在全球推出。我们的免费层级用户将获得有限的免费配额,用完后将恢复使用原版 Nano Banana 模型。Google AI Plus、Pro 和 Ultra 订阅用户将获得更高配额。对于 Search 中的 AI Mode,Nano Banana Pro 在美国面向 Google AI Pro 和 Ultra 订阅用户开放。对于 NotebookLM,Nano Banana Pro 也面向全球订阅用户开放。
- 专业人士:我们正在将 Google Ads 中的图像生成升级为 Nano Banana Pro,把前沿的创意和编辑能力直接交到全球广告主手中。它也从今天开始向 Google Slides 和 Vids 中的 Workspace 客户推出。
- 开发者和企业:开始在 Gemini API 和 Google AI Studio 中推出,并在 Google Antigravity 中用于创建丰富的 UX 布局和模型;企业今天即可开始在 Vertex AI 中构建,以进行规模化创作,并且即将登陆 Gemini Enterprise。
- 创意人士:开始向 Flow(我们的 AI 电影制作工具)中的 Google AI Ultra 订阅者推出,为创意人士、电影制作人和营销人员提供对画面和场景更高的精度和控制力。
如何识别 Gemini 应用中由 AI 生成的图像
我们认为,了解一张图片何时由 AI 生成至关重要。这就是为什么所有由 Google 工具生成的媒体都会嵌入我们不可感知的 SynthID 数字水印。
今天,我们正在把一款强大的验证工具直接交到消费者手中:借助 SynthID 技术,你现在可以将图片上传到 Gemini 应用,并直接询问它是否由 Google AI 生成。我们将先从图片的英文提示词开始,并将很快扩展到更多语言、音频和视频。
除 SynthID 外,我们还将在免费版和 Google AI Pro 层级用户生成的图片上保留可见水印(Gemini 闪光标识),以便更容易识别这些图片为 Google AI 生成。
考虑到专业工作需要干净的视觉画布,我们将移除 Google AI Ultra 订阅用户以及 Google AI Studio 开发者工具内生成图片上的可见水印。
你可以在我们的博客文章中进一步了解我们如何通过 SynthID 提高 AI 内容的透明度。










