中文内容
Gemini 3.1 Flash-Lite:为规模化智能而生
2026 年 3 月 3 日
·为您的最高负载工作流获取行业领先的智能。
通用摘要
Gemini 3.1 Flash-Lite 现已通过 Google AI Studio 中的 Gemini API 向开发者提供预览,企业可通过 Vertex AI 访问。定价为每百万输入 token 0.25 美元,每百万输出 token 1.50 美元,性价比高且比 2.5 Flash 更快。可使用 3.1 Flash-Lite 进行翻译、内容审核、生成用户界面和创建模拟等任务。
Summaries were generated by Google AI. Generative AI is experimental.基础解释
Google 推出了一款名为 Gemini 3.1 Flash-Lite 的新 AI 模型。它速度极快且使用成本低,因此更多人可以使用。该 AI 擅长翻译语言和检查内容等工作。一些公司已开始用它解决难题,因为它既聪明又高效。
Summaries were generated by Google AI. Generative AI is experimental.探索其他风格:
- 通用摘要
- 基础解释
您的浏览器不支持音频元素。
今天,我们推出 Gemini 3.1 Flash-Lite,这是我们最快且最具成本效益的 Gemini 3 系列模型。专为大规模高负载开发者工作流构建,3.1 Flash-Lite 以其价格和模型层级提供高质量表现。
从今天起,3.1 Flash-Lite 将通过 Google AI Studio 中的 Gemini API 向开发者提供预览版,企业可通过 Vertex AI 访问。
在不妥协的前提下实现成本效益
定价仅为每百万输入 token 0.25 美元和每百万输出 token 1.50 美元,3.1 Flash-Lite 以大型模型的一小部分成本提供增强的性能。根据 Artificial Analysis 基准测试,它在首字生成时间上比 2.5 Flash 快 2.5 倍,输出速度提高 45%,同时保持相同或更好的质量。这种低延迟是高频工作流所需的,使其成为开发者构建响应式、实时体验的理想模型。
Gemini 3.1 Flash-Lite 在速度和质量上优于 2.5 Flash。
3.1 Flash-Lite 在 Arena.ai 排行榜上取得了令人印象深刻的 1432 Elo 分数,并在推理和多模态理解基准测试中优于同级别的其他模型,包括 GPQA Diamond 得分 86.9% 和 MMMU Pro 得分 76.8%——甚至超越了以前代次更大的 Gemini 模型,如 2.5 Flash。
为开发者提供的规模化自适应智能
除了原始性能外,Gemini 3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中标准配备思考层级功能,赋予开发者控制权和灵活性,可选择模型对任务的“思考”程度,这对管理高频工作流至关重要。3.1 Flash-Lite 可处理大规模任务,如以成本为优先的高容量翻译和内容审核。它还能处理需要更深入推理的更复杂工作负载,如生成用户界面和仪表板、创建模拟或遵循指令。
3.1 Flash-Lite 可瞬间用数百种不同类别的产品填充电子商务线框图。
3.1 Flash-Lite 可利用实时预报和历史数据生成动态天气仪表板。
3.1 Flash-Lite 可为企业创建一个能够执行多功能多步骤任务的 SaaS 代理。
3.1 Flash-Lite 可快速分析并排序大量图像等内容。
AI Studio 和 Vertex AI 上的早期访问开发者,以及 Latitude、Cartwheel 和 Whering 等公司已经在使用 3.1 Flash-Lite 规模化解决复杂问题。早期测试者强调了 3.1 Flash-Lite 的效率和推理能力,称其能以更大层级模型的精度处理复杂输入,并能遵循指令并保持一致性。
我们期待看到您利用 3.1 Flash-Lite 和其余 Gemini 3 系列模型构建的成果。







