元鉴
返回中文阅读流

Google DeepMind Blog

Gemini 3.5:具备行动能力的前沿智能

Gemini 3.5 旨在帮助你执行复杂的智能体式工作流。

中文内容

已翻译official company source英文原文2026-05-15

Gemini 3.5:具备行动能力的前沿智能

2026 年 5 月 19 日

·

Gemini 3.5 旨在帮助你执行复杂的智能体式工作流。

Gemini 3.5 text and multi-colored star icon on an abstract blue background.
本篇内容
本篇内容
  • 正文:Gemini 3.5 Flash
  • 前沿智能,卓越速度
  • 大规模智能体任务
  • 更丰富的图形
  • 现实世界影响
  • 个人 AI 智能体
  • 基于前沿安全防护构建
  • 今日可用

今天,我们推出 Gemini 3.5,这是我们最新的模型系列,将前沿智能与行动能力相结合。这代表着在构建更强大、更智能的智能体方面迈出了重大一步。我们将通过发布 3.5 Flash 开启这一系列。它为智能体和编码提供前沿性能,擅长处理可带来现实实用价值的复杂长周期任务。

3.5 Flash 今日面向全球数十亿用户开放:

  • 所有人均可通过 Gemini 应用和 Google 搜索中的 AI Mode 使用
  • 开发者可通过我们以智能体为优先的开发平台 Google Antigravity,以及 Google AI Studio 和 Android Studio 中的 Gemini API 使用
  • 企业可通过 Gemini Enterprise Agent Platform 和 Gemini Enterprise 使用。

我们也在努力开发 3.5 Pro。它已在内部使用,我们期待下个月推出。

3.5 Flash:面向智能体和编码的前沿性能

Gemini 3.5 Flash 以你对 Flash 系列所期待的速度,在多个维度上提供可媲美大型旗舰模型的智能。它是我们迄今最强的智能体和编码模型,在 Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和 MCP Atlas(83.6%)等具有挑战性的编码和智能体基准测试中优于 Gemini 3.1 Pro,并在多模态理解方面领先(CharXiv Reasoning 上为 84.2%)。按每秒输出 token 数衡量,它比其他前沿模型快 4 倍。

Performance comparison table of Gemini, Claude, and GPT models across various benchmarks, highlighting Gemini 3.5 Flash.

3.5 Flash 位于 Artificial Analysis 指数的右上象限,以卓越速度提供前沿级智能——证明你不再需要在质量与延迟之间取舍。

an image showing "Artificial Analysis Intelligence Index vs Output Speed

3.5 Flash:大规模智能体任务

这种速度与性能的平衡,使 3.5 Flash 非常适合处理长周期智能体任务。过去开发者需要数天或审计员需要数周完成的工作,3.5 Flash 现在可以帮助在一小部分时间内完成,成本往往不到其他前沿模型的一半。无论是开发新应用、维护代码库,还是帮助准备财务文件,它都能快速规划、构建并迭代,以解决现实世界问题。

结合更新后的 Antigravity harness,3.5 Flash 可成为部署协作式子智能体的强大引擎,以大规模应对最苛刻使用场景中的问题。在监督下,它能够可靠执行多步骤工作流和编码任务,同时保持前沿性能。

在 Antigravity 的支持下,3.5 Flash 可根据动态标准自动重命名和分类非结构化资产,执行多步骤工作流。

借助 Antigravity,3.5 Flash 使用两个智能体综合 AlphaZero 论文,并在六小时内编写出一款完全可玩的游戏。

3.5 Flash 使用 Antigravity harness 将混乱的遗留代码库转换为 Next.js。

3.5 Flash 使用子智能体在 Antigravity 中创建新的城市景观。

3.5 Flash 使用两个智能体:一个构建者和一个玩家,通过快速自我改进循环在 Antigravity 中开发游戏。

基于 Gemini 3 强大的多模态基础,3.5 Flash 可生成更丰富、更具交互性的 Web UI 和图形。

3.5 Flash 在 AI Studio 上为一篇研究论文创建交互式动画。

3.5 Flash 在 AI Studio 上将纯文本描述转化为交互式硬件。

3.5 Flash 在 AI Studio 上并行执行多个概念,为学校募捐活动构建完整品牌概念。

3.5 Flash 在 AI Studio 上仅用 60 秒就为结账流程生成不同的 UX 方案。

3.5 Flash:现实世界影响

3.5 Flash 的现实世界智能体能力已经在为我们的开发者和企业带来有意义的进展。在开发 3.5 模型系列时,我们与行业伙伴密切合作,了解他们的工作流中哪些环节会产生繁重劳动和复杂性。合作伙伴正在看到有意义的影响——从银行和金融科技公司自动化需要数周的工作流,到数据科学团队在复杂数据环境中发掘洞见。

Shopify 正在并行运行子智能体,长期分析复杂数据,以在全球范围内更准确地预测商家增长。

Macquarie Bank 正在试点 3.5 Flash 如何通过对 100 多页复杂文档进行推理、检索相关信息并以低延迟给出可靠建议,来加速客户入职流程。

Salesforce 正在将 3.5 Flash 集成到 Agentforce 中,通过部署多个可保留上下文并执行复杂多轮工具调用的子智能体,可靠地自动化复杂企业任务。

3.5 Flash 正在帮助 Ramp 通过对复杂发票的多模态理解,并结合对历史模式的推理,实现更智能、更可靠的 OCR。

Xero 正在部署智能体来自主管理复杂的多周工作流,例如识别供应商并收集 1099 税表信息,使小型企业能够自动化繁琐的行政任务。

Databricks 正在使用智能体式工作流监控和检索实时信息,跨海量数据集进行推理以诊断问题、确定修复方法并为数据科学家提出解决方案。

个人 AI 智能体:基于 3.5 Flash 构建

3.5 Flash 现已成为全球 Gemini 应用和搜索中 AI Mode 的默认模型。在今天的 I/O 上,我们展示了它的智能体能力如何为新功能提供支持,将前沿级智能带入你的日常生活。

新的 Gemini Spark 是你的个人 AI 智能体,使用 3.5 Flash。它全天候运行,帮助你管理数字生活,在你的指导下代表你采取行动。我们今天开始向受信任测试者推出 Gemini Spark,并计划下周在美国向 Google AI Ultra 订阅用户推出 Beta 版。

an image of Gemini Spark

Gemini Spark 使用 3.5 Flash 来帮助完成这些任务

an image of Gemini Spark

Gemini Spark 使用 3.5 Flash 来帮助完成这些任务

an image of Gemini Spark

Gemini Spark 使用 3.5 Flash 来帮助完成这些任务

an image of Gemini Spark

Gemini Spark 使用 3.5 Flash 来帮助完成这些任务

an image of Gemini Spark

Gemini Spark 使用 3.5 Flash 来帮助完成这些任务

3.5 Flash 增强的智能体编码能力也在搜索中带来更加智能的体验,从引入可全天候为你工作的全新信息智能体,到解锁更动态的生成式 UI 体验。更多信息请参阅我们的博客文章。

搜索利用 3.5 Flash 构建交互式可视化内容,解释 Gyroid 图案。

Gemini 3.5:基于前沿安全防护构建

Gemini 3.5 是根据我们的

原文标题

Gemini 3.5: frontier intelligence with action