元鉴
返回中文阅读流

Google DeepMind Blog

伴随 Gemini 3 开启智能新时代

来自 Google DeepMind 博客的最新公开更新。

中文内容

已翻译official company source英文原文2025-11-18

Gemini 3 开启智能新时代

2025 年 11 月 18 日

·

Gemini 3 是我们最智能的模型,帮助你将任何想法变为现实。

Read AI-generated summary

总体摘要

Google 推出 Gemini 3,这是其最智能的 AI 模型,增强了推理和多模态能力。现在,你可以在 Gemini 应用、AI Studio 和 Vertex AI 等 Google 产品中访问 Gemini 3。Gemini 3 Deep Think 模式即将面向 Ultra 订阅用户推出,后续还将推出更多模型。

Summaries were generated by Google AI. Generative AI is experimental.

要点

《Gemini 3 开启智能新时代》介绍了 Google 最新、最智能的 AI 模型。Gemini 3 Pro 在推理、多模态和编码基准测试中超越了此前的模型。Gemini 3 Deep Think 模式进一步拓展了智能在复杂问题上的边界。你可以使用 Gemini 3 通过改进的推理和工具使用来学习、构建和规划任何事情。Gemini 3 现已在多款 Google 产品中推出,Deep Think 即将上线。

Summaries were generated by Google AI. Generative AI is experimental.

探索其他风格:

  • 通用摘要
  • 要点
Gemini 3 logo in front of a black background with the number 3 in blue dots
在这个故事中
在这个故事中
  • 来自我们 CEO 的一则说明
  • 推出 Gemini 3
  • 正文:Gemini 3 Deep Think
  • 学习任何内容
  • 构建任何事物
  • 规划任何事情
  • 负责任的开发

您的浏览器不支持音频元素。

Listen to article
此内容由 Google AI 生成。生成式 AI 仍处于实验阶段
[[duration]] 分钟
语音 速度
语音
速度 正文:0.75X 正文:1X 正文:1.5X 正文:2X

来自 Google 和 Alphabet 首席执行官 Sundar Pichai 的一则说明:

近两年前,我们开启了 Gemini 时代,这是我们作为一家公司有史以来开展的最重大的科学与产品工作之一。自那以来,看到人们如此喜爱它令人难以置信。AI Overviews 如今每月拥有 20 亿用户。Gemini 应用每月用户超过 6.5 亿,我们超过 70% 的 Cloud 客户在使用我们的 AI,1300 万开发者使用我们的生成式模型进行构建,而这只是我们所看到影响的一小部分。

得益于我们在 AI 创新上的差异化全栈方法——从领先的基础设施,到世界一流的研究、模型和工具,再到覆盖全球数十亿人的产品——我们能够以前所未有的速度将先进能力带给世界。

每一代 Gemini 都建立在上一代的基础之上,使你能够做得更多。Gemini 1 在原生多模态和长上下文窗口方面的突破,扩展了可处理信息的类型及其规模。Gemini 2 为智能体能力奠定了基础,并推动了推理和思考的前沿,帮助处理更复杂的任务和想法,最终使 Gemini 2.5 Pro 在 LMArena 上连续六个多月位居榜首。

现在,我们推出 Gemini 3——我们最智能的模型,它将 Gemini 的所有能力融为一体,让你能够将任何想法变为现实。

它在推理方面达到业界领先水平,旨在理解深度与细微差别——无论是感知创意构想中的微妙线索,还是拆解复杂问题中相互重叠的层次。Gemini 3 也更擅长判断你请求背后的上下文和意图,因此你只需更少提示就能获得所需内容。想到仅仅两年时间里,AI 已经从单纯读取文本和图像,发展到能够“读懂现场气氛”,这令人惊叹。

从今天开始,我们将以 Google 的规模推出 Gemini。这包括在 Search 的 AI Mode 中推出 Gemini 3,带来更复杂的推理和全新的动态体验。这是我们首次在发布首日就将 Gemini 引入 Search。Gemini 3 今天也将登陆 Gemini app,并面向 AI Studio 和 Vertex AI 中的开发者开放,同时也会进入我们全新的智能体开发平台 Google Antigravity——更多内容见下文。

与前几代一样,Gemini 3 再次推动了业界前沿水平。在这个新篇章中,我们将继续拓展智能、智能体和个性化的前沿,让 AI 真正为每个人提供帮助。

我们希望你喜欢 Gemini 3,我们会持续改进它,并期待看到你用它构建出什么。更多精彩,敬请期待!

推出 Gemini 3:我们最智能的模型,帮助你将任何想法变为现实

Google DeepMind 首席执行官 Demis Hassabis,以及 Google DeepMind 首席技术官兼 Google 首席 AI 架构师 Koray Kavukcuoglu,代表 Gemini 团队

今天,我们在通往 AGI 的道路上又迈出重要一步,并发布 Gemini 3。

它是世界上用于多模态理解的最佳模型,也是我们迄今为止最强大的智能体式和 vibe coding 模型,能够提供更丰富的可视化和更深入的交互性——这一切都建立在最先进推理能力的基础之上。

我们正通过发布 Gemini 3 Pro 预览版来开启 Gemini 3 时代,并于今日在一系列 Google 产品中提供该模型,让你能够在日常生活中用它来学习、构建和规划任何事情。我们还推出了 Gemini 3 Deep Think——这是一种增强型推理模式,可进一步提升 Gemini 3 的性能——并在向 Google AI Ultra 订阅用户开放之前,先向安全测试人员提供访问权限。

具备前所未有深度与细腻度的最先进推理能力

Gemini 3 Pro 凭借其最先进的推理能力和多模态能力,可以将任何想法变为现实。它在每一项主要 AI 基准测试中的表现都显著优于 2.5 Pro。

它以 1501 Elo 的突破性分数位居 LMArena Leaderboard 榜首。它展现出博士级推理能力,在 Humanity’s Last Exam(未使用任何工具的情况下为 37.5%)和 GPQA Diamond(91.9%)上取得最高分。它还为前沿模型在数学领域树立了新标准,在 MathArena Apex 上取得 23.4% 的最新最佳成绩。

除了文本之外,Gemini 3 Pro 以 MMMU-Pro 上 81% 和 Video-MMMU 上 87.6% 的成绩重新定义了多模态推理。它还在 SimpleQA Verified 上取得了 72.1% 的最新最佳成绩,显示出在事实准确性方面的巨大进步。这意味着 Gemini 3 Pro 非常擅长以高度可靠的方式解决科学、数学等广泛主题中的复杂问题。

Gemini 3 在一系列关键 AI 基准测试中达到当前最佳水平。请查看我们的评估方法详情。

Gemini 3 evaluation table against other AI models

Gemini 3 Pro 还为每一次交互带来了新的深度和细微差别。它的回答聪明、简洁且直接,以真正的洞见取代陈词滥调和奉承——告诉你需要听到的内容,而不只是你想听到的内容。它充当真正的思维伙伴,为你提供理解信息和表达自我的新方式,从通过生成代码来创建高保真可视化以解释复杂科学概念,到创意头脑风暴。

Gemini 3 可以编写托卡马克中等离子体流动的可视化代码,并创作一首捕捉聚变物理内涵的诗。

正文:Gemini 3 Deep Think

Gemini 3 Deep Think 模式进一步拓展了智能的边界,在 Gemini 3 的推理和多模态理解能力上实现跃升,帮助你解决更加复杂的问题。

在测试中,Gemini 3 Deep Think 在 Humanity’s Last Exam(不使用工具时为 41.0%)和 GPQA Diamond(93.8%)上的表现,超过了 Gemini 3 Pro 已经令人印象深刻的性能。它还在 ARC-AGI-2 上取得了前所未有的 45.1%(使用代码执行,ARC Prize Verified),展示了其解决全新挑战的能力。

Gemini 3 Deep Think 模式在一些最具挑战性的 AI 基准测试中表现出色。查看我们的评估方法详情。

Evaluation chart for Gemini 3 Deep Think

Gemini 3 帮助你学习、构建和规划任何事情

学习任何内容

Gemini 从一开始就被打造为能够无缝综合关于任何主题的多种模态信息,包括文本、图像、视频、音频和代码。Gemini 3 推动多模态推理的前沿,结合其最先进的推理、视觉和空间理解能力、领先的多语言表现以及 100 万 token 的上下文窗口,帮助你以适合自己的方式学习。

例如,如果你想学习家族传统烹饪方法,Gemini 3 可以解读并翻译不同语言的手写食谱,将其制作成一本可分享的家庭食谱。或者,如果你想学习一个新主题,可以向它提供学术论文、长视频讲座或教程,它可以生成用于交互式抽认卡、可视化内容或其他形式的代码,帮助你掌握材料。它甚至可以分析你的匹克球比赛视频,识别你可以改进的方面,并生成一份用于整体动作改进的训练计划。

Gemini 3 可以帮助你学习并保留家族烹饪传统。可在 Gemini Canvas 中试用。

Gemini 3 可以帮助你分析研究论文等复杂信息,并可以生成交互式指南的代码。

获取针对你的匹克球比赛的专家级运动分析,帮助提升你的比赛表现。

为了帮助你更好地理解网络上的信息,Search 中的 AI Mode 现在使用 Gemini 3 来支持新的生成式 UI 体验,例如沉浸式视觉布局以及交互式工具和模拟,所有这些都会根据你的查询完全即时生成。

通过 Search 中 AI Mode 的生成式 UI,学习 RNA polymerase 如何工作这类复杂主题。

构建任何东西

在 2.5 Pro 成功的基础上,Gemini 3 兑现了承诺,让开发者能够将任何想法变为现实。它在零样本生成方面表现出色,并能处理复杂的提示和指令,以呈现更丰富、更具交互性的 Web UI。

Gemini 3 是我们迄今构建的最佳 vibe coding 和智能体编码模型——让我们的产品更具自主性,并提升开发者生产力。它以令人瞩目的 1487 Elo 得分位居 WebDev Arena 排行榜榜首。它在 Terminal-Bench 2.0 上也获得了 54.2% 的得分,该基准测试模型通过终端操作计算机的工具使用能力;在 SWE-bench Verified(76.2%)上也大幅优于 2.5 Pro,这是一个衡量编码智能体能力的基准。

你现在可以在 Google AI Studio、Vertex AI、Gemini CLI 以及我们的新智能体开发平台 Google Antigravity 中使用 Gemini 3 进行构建。它也可在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台上使用。

编写一款复古 3D 太空飞船游戏,配备更丰富的可视化效果和更强的交互性。可在 AI Studio 中试用。

通过使用代码构建、解构和重新混合细致的 3D 体素艺术,让你的想象力变为现实。可在 AI Studio 中试用。

使用 Gemini 3,通过着色器构建一个可玩的科幻世界。在 AI Studio 中试用。

你可以借助 Gemini 3,以 vibe coding 的方式编写更丰富、更具交互性的网页 UI 和应用。

推出全新的智能体优先开发体验

随着 Gemini 3 推动模型智能加速发展,我们有机会重新构想整个开发者体验。今天,我们发布 Google Antigravity,这是我们全新的智能体式开发平台,使开发者能够在更高的、面向任务的层级上开展工作。

借助 Gemini 3 的高级推理、工具使用和代理式编码能力,Google Antigravity 将 AI 辅助从开发者工具箱中的一个工具转变为一个主动的合作伙伴。虽然 Google Antigravity 的核心是人们熟悉的 AI IDE 体验,但其代理已被提升到一个专用界面,并被赋予对编辑器、终端和浏览器的直接访问权限。现在,代理可以代表你自主规划并同时执行复杂的端到端软件任务,同时验证自己的代码。

除了 Gemini 3 Pro,Google Antigravity 还与我们最新的 Gemini 2.5 Computer Use 模型(用于浏览器控制)以及我们评分最高的图像编辑模型 Nano Banana(Gemini 2.5 Image)紧密集成。

Google Antigravity 使用 Gemini 3 为一款航班追踪应用驱动端到端的代理式工作流。该代理会独立规划、编写应用代码,并通过基于浏览器的计算机使用来验证其运行。

规划任何事情

自从我们通过 Gemini 2 引入智能体时代以来,我们取得了许多进展,不仅提升了 Gemini 的编码智能体能力,也改进了其在更长时间跨度内可靠提前规划的能力。Gemini 3 通过在 Vending-Bench 2 排行榜上名列榜首证明了这一点;该基准通过管理一个模拟的自动售货机业务来测试更长时间跨度的规划能力。Gemini 3 Pro 在完整模拟一年的运营中保持一致的工具使用和决策能力,在不偏离任务的情况下带来更高回报。

与其他前沿模型相比,Gemini 3 Pro 展现出更好的长期规划能力,能够产生显著更高的回报。

Chart showing Gemini 3 Pro outperforming other AI models on long-horizon planning

原文标题

A new era of intelligence with Gemini 3