元鉴
返回中文阅读流

Google DeepMind Blog

介绍 Gemma 3 270M:高效能 AI 的紧凑模型

今天,我们为 Gemma 3 工具包新增了一款高度专用工具:Gemma 3 270M,这是一个拥有 2.7 亿参数的紧凑型模型,专为任务特定微调设计。

中文内容

已翻译official company source英文原文2025-10-23

过去几个月对 Gemma 开源模型家族来说是激动人心的时刻。我们推出了 Gemma 3 和 Gemma 3 QAT,为单云和桌面加速器提供了最先进的性能。随后,我们宣布了 Gemma 3n 的完整发布,这是一种面向移动设备的架构,将强大的实时多模态 AI 直接带到边缘设备。我们的目标是为开发人员提供有用的 AI 构建工具,我们继续对您共同创建的充满活力的 Gemmaverse 感到惊叹,上周下载量超过 2 亿,让我们一同庆祝。

今天,我们为 Gemma 3 工具包添加了新的专用工具:Gemma 3 270M,这是一个紧凑的 2.7 亿参数模型,专为任务特定的微调设计,内置了强大的指令遵循和文本结构化能力。

Gemma 3 270M
Gemma 3 270M 为小型模型带来了强大的指令遵循能力。如 IFEval 基准测试(测试模型遵循可验证指令的能力)所示,它为其规模树立了新的性能水平,使高级 AI 功能更容易用于端侧和研究应用。

Gemma 3 270M 的核心功能

  • 紧凑而强大的架构:我们的新模型总共有 2.7 亿个参数:由于词汇量大,嵌入参数为 1.7 亿个,transformer 块为 1 亿个。得益于 256k tokens 的大词汇量,该模型可以处理特定和罕见的 token,使其成为在特定领域和语言中进一步微调的强大基础模型。

  • 极高的能效:Gemma 3 270M 的一个关键优势是其低功耗。Pixel 9 Pro SoC 的内部测试显示,INT4 量化模型在 25 次对话中仅使用了 0.75% 的电量,使其成为我们最节能的 Gemma 模型。

  • 指令遵循:随预训练检查点一起发布了经过指令微调的模型。虽然该模型并非为复杂的对话用例设计,但它是一个开箱即用即可遵循一般指令的强大模型。

  • 生产就绪的量化:提供量化感知训练 (QAT) 检查点,使您能够以 INT4 精度运行模型,性能损耗极小,这对于部署到资源受限的设备至关重要。

合适的工具做合适的事

在工程中,成功由效率定义,而不仅仅是原始功率。你不会用大锤挂画框。这一原则同样适用于构建 AI。

Gemma 3 270M 体现了这种“合适的工具做合适的事”的理念。它是一个高质量的基础模型,开箱即用的指令遵循效果良好,其真正力量通过微调解锁。一旦专业化,它可以以卓越的准确性、速度和成本效益执行文本分类和数据提取等任务。通过从紧凑、有能力的模型开始,您可以构建精简、快速且运营成本大幅降低的生产系统。

现实世界的成功蓝图

这种方法的力量已经在现实世界中取得了不可思议的结果。一个完美的例子是 Adaptive ML 与 SK Telecom 的合作工作。面对细微的多语言内容审核挑战,他们选择了专业化。他们没有使用巨大的通用模型,而是微调了 Gemma 3 4B 模型。结果令人震惊:专门的 Gemma 模型在其特定任务上不仅满足而且超过了大型专有模型的性能。

Gemma 3 270M 旨在让开发者走得更远,为定义明确的任务解锁更高的效率。它是创建小型专门模型舰队的完美起点,每个都是各自任务的专家。

但这种专业化的力量不仅仅用于企业任务;它还启用了强大的创意应用。例如,查看这个睡前故事生成器 Web 应用程序:

链接到 YouTube 视频(仅在禁用 JavaScript 时可见)

Gemma 3 270M 用于驱动使用 Transformers.js 的睡前故事生成器 Web 应用程序。模型的尺寸和性能使其适合离线、基于网络的创意任务。(署名:Hugging Face 团队的 Joshua (@xenovacom on X))

何时选择 Gemma 3 270M

Gemma 3 270M 继承了 Gemma 3 系列的先进架构和稳健的预训练,为您的自定义应用提供坚实基础。

以下是它的最佳选择时机:

  • 您拥有高容量、定义明确的任务。适用于情感分析、实体提取、查询路由、非结构化到结构化文本处理、创意写作和合规检查等功能。

  • 您需精打细算每一毫秒和每一分成本。大幅减少或消除生产中的推理成本,并为用户提供更快的响应。微调后的 2.7 亿模型可以在轻量级、廉价的基础设施或直接设备上运行。

  • 您需要快速迭代和部署。Gemma 3 270M 的小尺寸允许快速的微调实验,帮助您以小时而非天为单位找到适合您用例的完美配置。

  • 您需要确保用户隐私。因为模型可以完全在设备上运行,您可以构建处理敏感信息的应用,而无需将数据发送到云端。

  • 您想要一批专门的任务模型。构建和部署多个自定义模型,每个都针对不同任务进行专家级训练,而不会超出预算。

开始微调

我们要尽可能轻松地将 Gemma 3 270M 变成您自己的自定义解决方案。它与其余 Gemma 3 模型采用相同的架构,配有食谱和工具让您快速入门。您可以在 Gemma 文档中找到关于使用 Gemma 3 270M 进行全微调的指南。

  • 下载模型:从 Hugging Face、Ollama、Kaggle、LM Studio 或 Docker 获取 Gemma 3 270M 模型。我们同时发布预训练和指令微调模型。

  • 试用模型:在 Vertex AI 上试用,或使用流行的推理工具,如 llama.cpp Gemma.cpp、LiteRT、Keras 和 MLX。

  • 开始微调:使用您喜欢的工具,包括 Hugging Face、UnSloth 和 JAX。

  • 部署您的解决方案:微调后,您可以将专业模型部署到任何地方,从您自己的本地环境到 Google Cloud Run。

Gemmaverse 建立在创新不拘大小的理念之上。凭借 Gemma 3 270M,我们正在赋能开发者构建更智能、更快、更高效的 AI 解决方案。我们迫不及待地想看到您创建的专门模型。

发布于:
  • 正文:Gemma
  • 人工智能
  • 公告
  • 正文:Gemma 3
  • 正文:Gemma 3 QAT
  • 设备端人工智能
上一篇
下一篇

原文标题

Introducing Gemma 3 270M: The compact model for hyper-efficient AI