元鉴
返回中文阅读流

Google DeepMind Blog

Gemini 2.5:思考模型家族更新

了解 Gemini 2.5 最新模型更新:性能与准确性提升,Pro 稳定版、Flash 正式可用,新 Flash-Lite 预览发布。

中文内容

已翻译official company source英文原文2025-06-17

今天,我们很高兴分享 Gemini 2.5 模型家族的全面更新:

  • Gemini 2.5 Pro 已正式可用并进入稳定版(与 06-05 预览版相比无变化)

  • Gemini 2.5 Flash 已正式可用并进入稳定版(与 05-20 预览版相比无变化,价格更新见下文)

  • Gemini 2.5 Flash-Lite 现已提供预览版

Gemini 2.5 模型是思考型模型,能够在回应前通过内部思路进行推理,从而提升性能并提高准确性。每个模型都可以控制思考预算,使开发者能够选择模型在生成回复前何时以及进行多少“思考”。

Overview of our family of Gemini 2.5 thinking models
Gemini 2.5 思考模型家族概览

推出 Gemini 2.5 Flash-Lite

今天,我们推出 2.5 Flash-Lite 预览版,它在 2.5 模型家族中具备最低延迟和最低成本。它被设计为我们此前 1.5 和 2.0 Flash 模型的高性价比升级版本。它还在大多数评测中提供更好的性能,并降低首个 token 生成时间,同时实现更高的每秒 token 解码量。该模型非常适合分类或大规模摘要等高吞吐量任务。

Gemini 2.5 Flash-Lite 是一种推理模型,允许通过 API 参数动态控制思考预算。由于 Flash-Lite 针对成本和速度进行了优化,与我们的其他模型不同,“思考”默认关闭。除函数调用外,2.5 Flash-Lite 还支持我们所有原生工具,例如 Grounding with Google Search、Code Execution 和 URL Context。

Benchmarks for Gemini 2.5 Flash-Lite
Gemini 2.5 Flash-Lite 的基准测试

Gemini 2.5 Flash 与价格更新

过去一年,我们的研究团队持续推动 Flash 模型系列的帕累托前沿。当 2.5 Flash 最初发布时,我们尚未最终确定 2.5 Flash-Lite 的能力。我们还以“思考”和“非思考价格”推出,这导致开发者感到困惑。随着 Gemini 2.5 Flash 稳定版推出(即我们在 Google I/O 提供的同一个 05-20 模型预览版),并考虑到 2.5 Flash 的出色性能,我们正在更新 2.5 Flash 的价格:

  • 每 100 万输入 token 0.30 美元(*从输入 0.15 美元上调)

  • 每 100 万输出 token 2.50 美元(*从输出 3.50 美元下调)

  • 我们取消了思考与非思考之间的价格差异

  • 无论输入 token 大小如何,我们都保留单一价格层级

虽然我们努力在预览版和稳定版之间保持一致定价,以尽量减少干扰,但这是一项具体调整,反映了 Flash 的卓越价值,仍提供当前最佳的单位智能成本。

借助 Gemini 2.5 Flash-Lite,我们现在为对成本和延迟敏感、且对模型智能要求较低的用例提供了成本更低的选项(无论是否启用思考)。

Pricing updates for our Gemini Flash family
Gemini Flash 家族的价格更新

如果你正在使用 Gemini 2.5 Flash Preview 04-17,现有预览版价格将在其计划于 2025 年 7 月 15 日弃用前继续有效,届时该模型端点将被关闭。你可以迁移到正式可用模型“gemini-2.5-flash”,或切换到 2.5 Flash-Lite Preview 作为更低成本选项。

Gemini 2.5 Pro 持续增长

Gemini 2.5 Pro 的增长和需求持续保持在我们迄今所有模型中最陡峭的水平。为了让更多客户在生产环境中基于该模型构建,我们将该模型的 06-05 版本设为稳定版,并保持与此前相同的帕累托前沿价格点。

我们预计,在需要最高智能和最多能力的场景中,Pro 将表现突出,例如编码和代理式任务。Gemini 2.5 Pro 是许多最受喜爱的开发者工具的核心。

Top developer tools using Gemini 2.5 Pro, featuring Cursor, Bolt, Cline, Cognition, Windsurf, GitHub, Lovable, Replit, and Zed Industries
使用 Gemini 2.5 Pro 的顶级开发者工具

如果你正在使用 2.5 Pro Preview 05-06,该模型将持续可用至 2025 年 6 月 19 日,之后将被关闭。如果你正在使用 2.5 Pro Preview 06-05,只需将模型字符串更新为“gemini-2.5-pro”即可。

我们迫不及待想看到更多领域受益于 2.5 Pro 的智能,并期待在不久的将来分享更多关于超越 Pro 扩展的信息。

发布于:
  • 正文:Gemini
  • 正文:AI
  • 公告
  • 正文:Gemini 2.5 Flash-Lite
  • AI 模型
  • 正文:Gemini 2.5 Pro
  • 正文:Vertex AI
  • 开发者工具
  • 正文:Gemini 2.5
  • 正文:Gemini 2.5 Flash
  • 机器学习
  • 正文:Google AI Studio
上一篇
下一篇

原文标题

Gemini 2.5: Updates to our family of thinking models