中文内容
开始使用 Gemini 3 构建
2025 年 11 月 18 日
·无论你是经验丰富的开发者,还是 vibe coder,Gemini 3 都可以帮助你将任何想法变为现实。
总体摘要
Google 正在推出 Gemini 3 Pro,这是他们最智能的模型,在 AI 基准测试和编码任务中优于以往版本。你可以通过 Google AI Studio 和 Vertex AI 中的 Gemini API 访问它,或试用 Google Antigravity 平台进行智能体式开发。现在就开始构建,探索其在多模态理解、视觉推理和 vibe coding 方面的能力。
Summaries were generated by Google AI. Generative AI is experimental.要点
“Start building with Gemini 3”介绍了 Google 最智能的模型,用于将任何想法变为现实。Gemini 3 Pro 在 AI 基准测试中超越了此前版本,并且在代理式工作流和编码任务方面表现出色。你可以在 Google AI Studio、Vertex AI 以及 Google Antigravity 等开发者工具中使用 Gemini 3 Pro。该模型解锁了“vibe coding”,让你可以在 Google AI Studio 中通过自然语言提示创建应用。Gemini 3 Pro 在多模态理解、视觉推理和空间推理方面表现卓越,可用于各种应用。
Summaries were generated by Google AI. Generative AI is experimental.探索其他风格:
- 通用摘要
- 要点
今天,我们推出 Gemini 3,这是我们最智能的模型,能够帮助将任何想法变为现实。Gemini 3 Pro 建立在最先进推理能力的基础之上,与此前版本相比,在各项主要 AI 基准测试中都取得了无与伦比的成果。它在编码方面也超越了 2.5 Pro,能够熟练处理智能体式工作流和复杂的零样本任务。
Gemini 3 Pro 可直接融入现有的生产级智能体和编码工作流,同时也能支持此前无法实现的新用例。对于 20 万 tokens 或以下的提示词,它通过 Google AI Studio 中的 Gemini API 和面向企业的 Vertex AI 以预览版形式提供,价格为每百万输入 tokens 2 美元、每百万输出 tokens 12 美元(速率限制和完整定价详情请参见定价说明)。此外,它也可通过更广泛生态系统中你偏好的开发者工具使用,并在 Google AI Studio 中以带有速率限制的形式免费提供。
智能体式编码
开发者正花费越来越多时间在 AI 的协助下创建软件。基于 Gemini 2.5 Pro 的发展势头以及所有反馈,Gemini 3 Pro 为智能体式编码模型所能实现的可能性提供了新的智能基础。
Gemini 3 Pro 在 Terminal-Bench 2.0 上得分为 54.2%,该基准测试模型通过终端操作计算机时的工具使用能力。
你可以在 Google Antigravity 这一全新的智能体式开发平台中感受到该模型的强大能力,此外也可在 Gemini CLI、Android Studio 以及 Cursor、GitHub、JetBrains、Manus、Cline 等其他编码产品中体验到。
正文:Google Antigravity
为推进模型与 IDE 的协作方式,我们推出 Google Antigravity,以展示 Gemini 3 所能实现的可能性。它是一个智能体式开发平台,使开发者能够通过跨工作区管理智能体,在更高层级、面向任务的层面开展工作,同时其核心仍保留熟悉的 AI IDE 体验。
这是一种更快速的开发方式:你扮演架构师的角色,与能够在编辑器、终端和浏览器中自主运行的智能代理协作。这些代理会规划并执行复杂的软件任务,并通过详细的产物向用户传达其工作内容。这提升了开发的各个方面,从构建功能、UI 迭代和修复 bug,到研究和生成报告。访问 Google Antigravity 网站即可免费下载公开预览版,目前已支持 MacOS、Windows 和 Linux。
正文:Gemini API
借助 Gemini 3,我们正在发布一款客户端 bash 工具,使模型能够在代理式工作流中提出 shell 命令,用于导航本地文件系统、驱动开发流程以及自动化系统操作等任务。我们还将其与一款托管的服务器端 bash 工具配套使用,用于多语言代码生成和安全原型设计。该工具现已在 Gemini API 中向早期访问合作伙伴开放,并将很快全面推出。
此外,Gemini 托管工具 Grounding with Google Search 和 URL context 现在可以与结构化输出结合使用。这对于构建涉及获取和提取数据、随后以特定格式输出这些数据以供下游代理式任务使用的代理式用例尤其强大。
氛围编程
Gemini 3 Pro 释放了“氛围编程”的真正潜力,在这种方式中,自然语言就是你唯一需要的语法。通过显著提升复杂指令遵循能力和深度工具使用能力,该模型可以用一条提示词将一个高层次想法转化为一个完全交互式应用。它承担了多步骤规划和编码细节的繁重工作,提供更丰富的视觉效果和更深入的交互性,让你能够专注于创意愿景。
Gemini 3 Pro 以令人印象深刻的 1487 Elo 分数位居 WebDev Arena 排行榜榜首。
正文:Google AI Studio
无论是通过单个提示词构建一款游戏、根据非结构化语音笔记生成一个交互式落地页,还是从餐巾纸草图创建一个完整的应用,开发者都可以借助 Gemini 3 将他们的想法变为现实。通过这一模型,我们将单提示词生成能力推进到前所未有的水平,这意味着你可以用一个提示词就从创意走向由 AI 驱动的应用,就像这款在 Google AI Studio 中构建的复古游戏一样。
我们打造 Google AI Studio,是为了让它成为你从提示词到 AI 原生应用的最快路径。Build mode 让你能够以前所未有的速度添加 AI 能力,自动接入合适的模型和 API,而 annotations 等功能则支持快速且直观的迭代。你现在就可以在 Google AI Studio 中开始使用 Gemini 3 进行构建。
多模态理解
Gemini 3 是全球最擅长复杂多模态理解的模型,并在用于复杂图像推理的 MMMU-Pro 和用于视频理解的 Video MMMU 上创下新高。结合其智能能力和 100 万 token 的上下文窗口,开发者在构建关键多模态用例时可以看到显著提升。为了让你更好地控制延迟和成本,现在你可以根据应用所需的视觉保真度,在 Gemini API 中以更细粒度配置多模态视觉处理。
视觉推理
Gemini 3 Pro 在文档理解方面处于同类最佳水平,超越了简单的 OCR(光学字符识别),能够智能地处理复杂的文档理解和推理。
你可以在我们的演示应用中看到该模型的视觉理解、推理和编码能力;该应用可在 Google AI Studio 中将任何想法变为现实。
空间推理
该模型改进的空间理解能力也推动了其在具身推理任务中的强劲表现,例如指向、轨迹预测和任务进展,从而在自动驾驶汽车、XR 设备和机器人等领域解锁新的用例。
其空间推理能力还支持对桌面、移动端和操作系统屏幕的智能屏幕理解,为计算机使用代理带来显著的性能提升。该模型还能够基于鼠标移动和屏幕标注理解用户行为意图,从而解锁类似这个 Visual Computer 演示应用的新颖体验。
视频推理
Gemini 3 Pro 能够通过高帧率理解捕捉快速动作,确保开发者不会错过快速移动场景中的关键时刻。除了速度之外,长上下文回忆能力还可用于综合数小时连续视频中的叙事,并精准定位具体细节。
今天,构建未来
Gemini 3 Pro 现已集成到许多开发者产品和工具中,可无缝融入您现有的工作流,并解锁全新的编码方式。
- 使用 Gemini API 构建:您可以通过 Google AI Studio 和面向企业的 Vertex AI,立即将 Gemini 3 Pro 集成到您的应用程序中。为支持该模型更深层次的推理能力,我们在 API 中引入了新的思考级别和更精细的媒体分辨率参数,并对思考签名进行更严格的验证。此更新对于在多轮对话中保留模型的思考至关重要。请查看 Developer Guide 了解技术细节,并查看我们的 Prompting Guide,了解如何使用 Gemini 3 Pro 进行构建。
- 体验该模型的智能体能力:无论您是在为 Android 应用添加 AI 原生功能,通过 Gemini CLI 自动化工作流,还是在 Google Antigravity 中管理一组自主智能体,Gemini 3 Pro 都能为复杂的智能体架构提供所需的可靠性。
- 用 Gemini 3 Pro 进行 Vibe code:Google AI Studio 是你将任何想法变为现实的最快路径。在 Build 模式下开始,只需一个提示词即可生成一个功能完整的应用。如果你需要一点灵感,点击“I’m feeling lucky”,让 Gemini 3 Pro 同时处理创意火花和代码实现。
软件格局正在发生变化。随着 AI 改变构建者以及构建方式,我们致力于在你所在之处为你提供支持——为你提供工具,推动可能性的边界。
这只是 Gemini 3 时代的开始,但我们已经迫不及待想看到你用 Gemini 3 Pro 构建出什么!
- 开发者工具
- Gemini 模型








