元鉴
返回中文阅读流

Google DeepMind Blog

Gemini 3.1 Flash-Lite:为规模化智能而生

Gemini 3.1 Flash-Lite 是我们迄今为止最快且最具成本效益的 Gemini 3 系列模型。

中文内容

已翻译official company source英文原文2026-03-03

Gemini 3.1 Flash-Lite:为规模化智能而生

2026 年 3 月 3 日

·

为您的最高负载工作流获取行业领先的智能。

Gemini 团队
Read AI-generated summary

通用摘要

Gemini 3.1 Flash-Lite 现已通过 Google AI Studio 中的 Gemini API 向开发者提供预览,企业可通过 Vertex AI 访问。定价为每百万输入 token 0.25 美元,每百万输出 token 1.50 美元,性价比高且比 2.5 Flash 更快。可使用 3.1 Flash-Lite 进行翻译、内容审核、生成用户界面和创建模拟等任务。

Summaries were generated by Google AI. Generative AI is experimental.

基础解释

Google 推出了一款名为 Gemini 3.1 Flash-Lite 的新 AI 模型。它速度极快且使用成本低,因此更多人可以使用。该 AI 擅长翻译语言和检查内容等工作。一些公司已开始用它解决难题,因为它既聪明又高效。

Summaries were generated by Google AI. Generative AI is experimental.

探索其他风格:

  • 通用摘要
  • 基础解释
Gemini 3.1 Flash Lite logo

您的浏览器不支持音频元素。

Listen to article
此内容由 Google AI 生成。生成式 AI 处于实验阶段
[[时长]] 分钟
语音 速度
语音
速度 0.75 倍速 1 倍速 1.5 倍速 2 倍速

今天,我们推出 Gemini 3.1 Flash-Lite,这是我们最快且最具成本效益的 Gemini 3 系列模型。专为大规模高负载开发者工作流构建,3.1 Flash-Lite 以其价格和模型层级提供高质量表现。

从今天起,3.1 Flash-Lite 将通过 Google AI Studio 中的 Gemini API 向开发者提供预览版,企业可通过 Vertex AI 访问。

在不妥协的前提下实现成本效益

定价仅为每百万输入 token 0.25 美元和每百万输出 token 1.50 美元,3.1 Flash-Lite 以大型模型的一小部分成本提供增强的性能。根据 Artificial Analysis 基准测试,它在首字生成时间上比 2.5 Flash 快 2.5 倍,输出速度提高 45%,同时保持相同或更好的质量。这种低延迟是高频工作流所需的,使其成为开发者构建响应式、实时体验的理想模型。

The image shows two bar charts titled "Speed & Cost Efficiency," comparing the "Output speed (higher is better)" and "Price (lower is better)" of Gemini 3.1 Flash-Lite against several other models, including Gemini 2.5 Flash-Lite, GPT-5 min

Gemini 3.1 Flash-Lite 在速度和质量上优于 2.5 Flash。

3.1 Flash-Lite 在 Arena.ai 排行榜上取得了令人印象深刻的 1432 Elo 分数,并在推理和多模态理解基准测试中优于同级别的其他模型,包括 GPQA Diamond 得分 86.9% 和 MMMU Pro 得分 76.8%——甚至超越了以前代次更大的 Gemini 模型,如 2.5 Flash。

The image displays a comparison table of several AI models, including "Gemini 3.1 Flash-Lite," "Gemini 2.5 Dynamic," "Gemini 2.5 Flash-Lite," "GPT-5 mini," "Claude 4.5 Haiku," and "Grok 4.1 Fast," across various metrics such as input/output

为开发者提供的规模化自适应智能

除了原始性能外,Gemini 3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中标准配备思考层级功能,赋予开发者控制权和灵活性,可选择模型对任务的“思考”程度,这对管理高频工作流至关重要。3.1 Flash-Lite 可处理大规模任务,如以成本为优先的高容量翻译和内容审核。它还能处理需要更深入推理的更复杂工作负载,如生成用户界面和仪表板、创建模拟或遵循指令。

3.1 Flash-Lite 可瞬间用数百种不同类别的产品填充电子商务线框图。

3.1 Flash-Lite 可利用实时预报和历史数据生成动态天气仪表板。

3.1 Flash-Lite 可为企业创建一个能够执行多功能多步骤任务的 SaaS 代理。

3.1 Flash-Lite 可快速分析并排序大量图像等内容。

AI Studio 和 Vertex AI 上的早期访问开发者,以及 Latitude、Cartwheel 和 Whering 等公司已经在使用 3.1 Flash-Lite 规模化解决复杂问题。早期测试者强调了 3.1 Flash-Lite 的效率和推理能力,称其能以更大层级模型的精度处理复杂输入,并能遵循指令并保持一致性。

Quote from Kolby Nottingham at Latitude regarding the instruction-following capabilities and speed of Google's model.
Quote from Andrew Carr at Cartwheel highlighting the speed and multimodal labeling capabilities of 3.1 Flash-Lite.2
Quote from Bianca Rangecroft at Whering about using 3.1 Flash-Lite for consistent item tagging and data labeling
Quote from Kaan Ortabas at HubX detailing the performance metrics and cost efficiency of Gemini 3.1 Flash-Lite.

我们期待看到您利用 3.1 Flash-Lite 和其余 Gemini 3 系列模型构建的成果。

原文标题

Gemini 3.1 Flash-Lite: Built for intelligence at scale