元鉴 Yuanjian

中文内容

已翻译official company source英文原文2025-10-23

过去几个月对 Gemma 开源模型家族来说是激动人心的时刻。我们推出了 Gemma 3 和 Gemma 3 QAT，为单云和桌面加速器提供了最先进的性能。随后，我们宣布了 Gemma 3n 的完整发布，这是一种面向移动设备的架构，将强大的实时多模态 AI 直接带到边缘设备。我们的目标是为开发人员提供有用的 AI 构建工具，我们继续对您共同创建的充满活力的 Gemmaverse 感到惊叹，上周下载量超过 2 亿，让我们一同庆祝。

今天，我们为 Gemma 3 工具包添加了新的专用工具：Gemma 3 270M，这是一个紧凑的 2.7 亿参数模型，专为任务特定的微调设计，内置了强大的指令遵循和文本结构化能力。

Gemma 3 270M 为小型模型带来了强大的指令遵循能力。如 IFEval 基准测试（测试模型遵循可验证指令的能力）所示，它为其规模树立了新的性能水平，使高级 AI 功能更容易用于端侧和研究应用。

Gemma 3 270M 的核心功能

紧凑而强大的架构：我们的新模型总共有 2.7 亿个参数：由于词汇量大，嵌入参数为 1.7 亿个，transformer 块为 1 亿个。得益于 256k tokens 的大词汇量，该模型可以处理特定和罕见的 token，使其成为在特定领域和语言中进一步微调的强大基础模型。

极高的能效：Gemma 3 270M 的一个关键优势是其低功耗。Pixel 9 Pro SoC 的内部测试显示，INT4 量化模型在 25 次对话中仅使用了 0.75% 的电量，使其成为我们最节能的 Gemma 模型。

指令遵循：随预训练检查点一起发布了经过指令微调的模型。虽然该模型并非为复杂的对话用例设计，但它是一个开箱即用即可遵循一般指令的强大模型。

生产就绪的量化：提供量化感知训练 (QAT) 检查点，使您能够以 INT4 精度运行模型，性能损耗极小，这对于部署到资源受限的设备至关重要。

合适的工具做合适的事

在工程中，成功由效率定义，而不仅仅是原始功率。你不会用大锤挂画框。这一原则同样适用于构建 AI。

Gemma 3 270M 体现了这种“合适的工具做合适的事”的理念。它是一个高质量的基础模型，开箱即用的指令遵循效果良好，其真正力量通过微调解锁。一旦专业化，它可以以卓越的准确性、速度和成本效益执行文本分类和数据提取等任务。通过从紧凑、有能力的模型开始，您可以构建精简、快速且运营成本大幅降低的生产系统。

现实世界的成功蓝图

这种方法的力量已经在现实世界中取得了不可思议的结果。一个完美的例子是 Adaptive ML 与 SK Telecom 的合作工作。面对细微的多语言内容审核挑战，他们选择了专业化。他们没有使用巨大的通用模型，而是微调了 Gemma 3 4B 模型。结果令人震惊：专门的 Gemma 模型在其特定任务上不仅满足而且超过了大型专有模型的性能。

Gemma 3 270M 旨在让开发者走得更远，为定义明确的任务解锁更高的效率。它是创建小型专门模型舰队的完美起点，每个都是各自任务的专家。

但这种专业化的力量不仅仅用于企业任务；它还启用了强大的创意应用。例如，查看这个睡前故事生成器 Web 应用程序：

链接到 YouTube 视频（仅在禁用 JavaScript 时可见）

Gemma 3 270M 用于驱动使用 Transformers.js 的睡前故事生成器 Web 应用程序。模型的尺寸和性能使其适合离线、基于网络的创意任务。（署名：Hugging Face 团队的 Joshua (@xenovacom on X)）

何时选择 Gemma 3 270M

Gemma 3 270M 继承了 Gemma 3 系列的先进架构和稳健的预训练，为您的自定义应用提供坚实基础。

以下是它的最佳选择时机：

您拥有高容量、定义明确的任务。适用于情感分析、实体提取、查询路由、非结构化到结构化文本处理、创意写作和合规检查等功能。

您需精打细算每一毫秒和每一分成本。大幅减少或消除生产中的推理成本，并为用户提供更快的响应。微调后的 2.7 亿模型可以在轻量级、廉价的基础设施或直接设备上运行。

您需要快速迭代和部署。Gemma 3 270M 的小尺寸允许快速的微调实验，帮助您以小时而非天为单位找到适合您用例的完美配置。

您需要确保用户隐私。因为模型可以完全在设备上运行，您可以构建处理敏感信息的应用，而无需将数据发送到云端。

您想要一批专门的任务模型。构建和部署多个自定义模型，每个都针对不同任务进行专家级训练，而不会超出预算。

开始微调

我们要尽可能轻松地将 Gemma 3 270M 变成您自己的自定义解决方案。它与其余 Gemma 3 模型采用相同的架构，配有食谱和工具让您快速入门。您可以在 Gemma 文档中找到关于使用 Gemma 3 270M 进行全微调的指南。

下载模型：从 Hugging Face、Ollama、Kaggle、LM Studio 或 Docker 获取 Gemma 3 270M 模型。我们同时发布预训练和指令微调模型。

试用模型：在 Vertex AI 上试用，或使用流行的推理工具，如 llama.cpp Gemma.cpp、LiteRT、Keras 和 MLX。

开始微调：使用您喜欢的工具，包括 Hugging Face、UnSloth 和 JAX。

部署您的解决方案：微调后，您可以将专业模型部署到任何地方，从您自己的本地环境到 Google Cloud Run。

Gemmaverse 建立在创新不拘大小的理念之上。凭借 Gemma 3 270M，我们正在赋能开发者构建更智能、更快、更高效的 AI 解决方案。我们迫不及待地想看到您创建的专门模型。

发布于：

正文：Gemma
人工智能
公告
正文：Gemma 3
正文：Gemma 3 QAT
设备端人工智能

介绍 Gemma 3 270M：高效能 AI 的紧凑模型