元鉴 Yuanjian

中文内容

已翻译professional media英文原文2026-05-13

智能体 AI 正在改变用户完成工作的方式。继 OpenClaw 取得成功后，社区正积极拥抱新型开源智能体框架。最新推出的是 Hermes Agent，它在不到三个月内就在 GitHub 上突破了 14 万星标，并且据 OpenRouter 数据显示，截至上周，它已成为全球使用最广泛的智能体。

Hermes 由 Nous Research 开发，专为可靠性和自我改进而设计——这两项特性在以往的智能体中历来难以实现。它在设计上不依赖特定提供商与模型，并针对全天候本地运行进行了优化，使 NVIDIA RTX PC、NVIDIA RTX PRO 工作站和 NVIDIA DGX Spark 成为能够全速、不间断运行该智能体的理想硬件。

Qwen 3.6 是阿里巴巴推出的新一代高性能开放权重大型语言模型（LLM）系列，非常适合运行 Hermes 这类本地智能体。Qwen 3.6 的 27B 和 35B 参数模型在性能上已超越上一代 120B 和 400B 参数模型，并依托 NVIDIA RTX 和 DGX Spark 运行，为智能体 AI 提供加速支持。

Hermes：本地 AI 智能体能力加速

与其他热门智能体一样，Hermes 能够集成即时通讯应用，可访问本地文件与应用程序，并支持 7×24 小时运行。但四项突出的能力使其与众不同：

自我演进技能：Hermes 能够编写并优化自身技能。每当智能体遇到复杂任务或收到反馈时，都会将所学内容保存为技能，以便随时间推移不断适应与提升。
独立子智能体：Hermes 将子智能体视为短暂存在且相互隔离的工作单元，专用于处理特定子任务，并配备聚焦的上下文与专属工具集。这使任务组织保持井然有序，最大限度减少智能体的上下文混淆，并允许 Hermes 在较小的上下文窗口下运行，对本地模型尤为理想。
设计上确保可靠性：Nous Research 对随 Hermes 发布的每项技能、工具和插件均经过严格筛选与压力测试。最终效果是：Hermes 开箱即用——即便搭载 300 亿参数级别的本地模型——也无需像大多数其他智能体框架那样频繁调试。
相同模型，更佳结果：开发者在跨框架使用相同模型的对比测试中，一致显示 Hermes 的表现更为出色。差异源于框架设计：Hermes 是主动编排层，而非简单的轻量封装，从而支持持久化的设备端智能体，而非传统的逐任务执行模式。

Hermes 智能体及其底层 LLM 均专为本地运行而设计——这意味着硬件质量直接决定了用户体验的优劣。NVIDIA RTX GPU 正是为此类工作负载量身打造的。

Qwen 3.6：本地实现的数据中心级智能

最新的 Qwen 3.6 模型基于广受好评的 Qwen 3.5 系列打造，为本地 AI 智能体带来又一次跨越式提升。全新的 Qwen 3.6 35B 模型仅需约 20GB 内存即可运行，其性能超越了需要 70GB 以上内存的 1200 亿参数模型。

此外，Qwen 3.6 27B 是一款全新的稠密模型，拥有更多活跃参数——其精度可与 Qwen 3.5 397B 等 4000 亿参数模型相媲美，而模型规模仅为十六分之一。在高端 RTX GPU 上运行可为该模型提供所需的算力，从而带来迅捷的使用体验。

这些模型是 Hermes 等本地智能体的理想选择，而 NVIDIA GPU 和 DGX Spark 则是运行它们的最快方式。NVIDIA Tensor Cores 能够加速 AI 推理，提供更高的吞吐量与更低的延迟——从而使 Hermes 能在数秒而非数分钟内完成多步骤任务或优化自身技能。

DGX Spark：始终在线的智能体计算机

像 Hermes 这样的智能体专为持续运行而设计，能够响应请求、规划多步任务、自主执行并自我改进。NVIDIA DGX Spark 是理想的搭档——一款紧凑高效的独立设备，专为持续、全天候的智能体工作流而打造。

凭借 128GB 统一内存和 1 petaflop 的 AI 算力，NVIDIA DGX Spark 可全天候运行 1200 亿参数的混合专家模型。全新 Qwen 3.6 35B 模型以更精简的体量提供了同等水平的智能——运行速度更快，并支持用户并发运行多项工作负载。

为最大化性能并提升易用性，请参阅 Hermes DGX Spark 指南。此外，请报名参加 NVIDIA “Build It Yourself” 智能体 AI 系列即将推出的实践课程，学习如何使用 NemoClaw 和 OpenShell 构建自主 AI 智能体。

NVIDIA DGX Spark 可通过 NVIDIA 的制造合作伙伴订购——请访问市场。

在 NVIDIA 硬件上开始使用 Hermes

在 NVIDIA 硬件上本地运行 Hermes 十分便捷。

访问 Hermes GitHub 仓库即可开始使用，并搭配您偏好的本地模型与运行时环境。通过 llama.cpp、LM Studio 或 Ollama，可让 Hermes 与 Qwen 3.6 协同运行。Hermes Agent 开箱即支持 LM Studio 和 Ollama，为您铺就部署本地智能体的最简路径。

无论您是探索个人智能体前沿的本地 AI 爱好者，还是致力于为工作流构建本地工具的开发者，运行于 NVIDIA 硬件上的 Hermes 都能提供功能强大且可靠的基础支撑。

敬请持续关注 RTX AI Garage 的最新动态，获取专为 NVIDIA RTX 硬件优化的最新开源模型与智能体更新。

#ICYMI：RTX AI Garage 最新动态

✨ 在使用 llama.cpp 运行 Qwen 3.6 模型时，NVIDIA RTX PRO GPU 可实现高达 3 倍的 token 生成速度。获取本地 AI 所需的实时响应能力，让智能体能够处理多步骤任务并不断优化自身能力，从而保持工作流无缝衔接。

Google 的 Gemma 4 26B 和 31B 模型现已提供 NVFP4 检查点版本，可在 NVIDIA Blackwell GPU 上实现更快的性能。将 NVFP4 检查点与 Google 全新的 Multi-Token Prediction drafters 结合使用，可在保持同等输出质量的前提下实现最高 3 倍的推理加速，从而使前沿级别的推理能力得以在本地 NVIDIA GPU 上运行。

Mistral Medium 3.5 版本同样于4月发布，新增了对 llama.cpp 和 Ollama 的兼容性更新，使用户能够在 NVIDIA RTX PRO 和 DGX Spark 系统上运行。

🦞 NVIDIA 近期推出了 NVIDIA NemoClaw，这是一个开源技术栈，通过提升安全性和支持本地模型，优化了 NVIDIA 设备上的 OpenClaw 体验。NemoClaw 现已支持适用于 Linux 的 Windows 子系统（WSL2），为微软平台上的爱好者与开发者提供支持。请按照这份分步操作指南，在 DGX Spark 上开始使用 NemoClaw。

在 Facebook、Instagram、TikTok 和 X 上关注 NVIDIA AI PC，并订阅 RTX AI PC 新闻通讯以随时掌握最新动态。

在 LinkedIn 和 X 上关注 NVIDIA Workstation。

请参阅有关软件产品信息的通知。

Hermes 解锁自改进 AI 智能体，由 NVIDIA RTX PC 和 DGX Spark 赋能