中文内容
智能体 AI 正在改变用户完成工作的方式。继 OpenClaw 取得成功后,社区正积极拥抱新型开源智能体框架。最新推出的是 Hermes Agent,它在不到三个月内就在 GitHub 上突破了 14 万星标,并且据 OpenRouter 数据显示,截至上周,它已成为全球使用最广泛的智能体。
Hermes 由 Nous Research 开发,专为可靠性和自我改进而设计——这两项特性在以往的智能体中历来难以实现。它在设计上不依赖特定提供商与模型,并针对全天候本地运行进行了优化,使 NVIDIA RTX PC、NVIDIA RTX PRO 工作站和 NVIDIA DGX Spark 成为能够全速、不间断运行该智能体的理想硬件。
Qwen 3.6 是阿里巴巴推出的新一代高性能开放权重大型语言模型(LLM)系列,非常适合运行 Hermes 这类本地智能体。Qwen 3.6 的 27B 和 35B 参数模型在性能上已超越上一代 120B 和 400B 参数模型,并依托 NVIDIA RTX 和 DGX Spark 运行,为智能体 AI 提供加速支持。
Hermes:本地 AI 智能体能力加速
与其他热门智能体一样,Hermes 能够集成即时通讯应用,可访问本地文件与应用程序,并支持 7×24 小时运行。但四项突出的能力使其与众不同:
- 自我演进技能:Hermes 能够编写并优化自身技能。每当智能体遇到复杂任务或收到反馈时,都会将所学内容保存为技能,以便随时间推移不断适应与提升。
- 独立子智能体:Hermes 将子智能体视为短暂存在且相互隔离的工作单元,专用于处理特定子任务,并配备聚焦的上下文与专属工具集。这使任务组织保持井然有序,最大限度减少智能体的上下文混淆,并允许 Hermes 在较小的上下文窗口下运行,对本地模型尤为理想。
- 设计上确保可靠性:Nous Research 对随 Hermes 发布的每项技能、工具和插件均经过严格筛选与压力测试。最终效果是:Hermes 开箱即用——即便搭载 300 亿参数级别的本地模型——也无需像大多数其他智能体框架那样频繁调试。
- 相同模型,更佳结果:开发者在跨框架使用相同模型的对比测试中,一致显示 Hermes 的表现更为出色。差异源于框架设计:Hermes 是主动编排层,而非简单的轻量封装,从而支持持久化的设备端智能体,而非传统的逐任务执行模式。
Hermes 智能体及其底层 LLM 均专为本地运行而设计——这意味着硬件质量直接决定了用户体验的优劣。NVIDIA RTX GPU 正是为此类工作负载量身打造的。
Qwen 3.6:本地实现的数据中心级智能
最新的 Qwen 3.6 模型基于广受好评的 Qwen 3.5 系列打造,为本地 AI 智能体带来又一次跨越式提升。全新的 Qwen 3.6 35B 模型仅需约 20GB 内存即可运行,其性能超越了需要 70GB 以上内存的 1200 亿参数模型。
此外,Qwen 3.6 27B 是一款全新的稠密模型,拥有更多活跃参数——其精度可与 Qwen 3.5 397B 等 4000 亿参数模型相媲美,而模型规模仅为十六分之一。在高端 RTX GPU 上运行可为该模型提供所需的算力,从而带来迅捷的使用体验。
这些模型是 Hermes 等本地智能体的理想选择,而 NVIDIA GPU 和 DGX Spark 则是运行它们的最快方式。NVIDIA Tensor Cores 能够加速 AI 推理,提供更高的吞吐量与更低的延迟——从而使 Hermes 能在数秒而非数分钟内完成多步骤任务或优化自身技能。
DGX Spark:始终在线的智能体计算机
像 Hermes 这样的智能体专为持续运行而设计,能够响应请求、规划多步任务、自主执行并自我改进。NVIDIA DGX Spark 是理想的搭档——一款紧凑高效的独立设备,专为持续、全天候的智能体工作流而打造。
凭借 128GB 统一内存和 1 petaflop 的 AI 算力,NVIDIA DGX Spark 可全天候运行 1200 亿参数的混合专家模型。全新 Qwen 3.6 35B 模型以更精简的体量提供了同等水平的智能——运行速度更快,并支持用户并发运行多项工作负载。
为最大化性能并提升易用性,请参阅 Hermes DGX Spark 指南。此外,请报名参加 NVIDIA “Build It Yourself” 智能体 AI 系列即将推出的实践课程,学习如何使用 NemoClaw 和 OpenShell 构建自主 AI 智能体。
NVIDIA DGX Spark 可通过 NVIDIA 的制造合作伙伴订购——请访问市场。
在 NVIDIA 硬件上开始使用 Hermes
在 NVIDIA 硬件上本地运行 Hermes 十分便捷。
访问 Hermes GitHub 仓库即可开始使用,并搭配您偏好的本地模型与运行时环境。通过 llama.cpp、LM Studio 或 Ollama,可让 Hermes 与 Qwen 3.6 协同运行。Hermes Agent 开箱即支持 LM Studio 和 Ollama,为您铺就部署本地智能体的最简路径。
无论您是探索个人智能体前沿的本地 AI 爱好者,还是致力于为工作流构建本地工具的开发者,运行于 NVIDIA 硬件上的 Hermes 都能提供功能强大且可靠的基础支撑。
敬请持续关注 RTX AI Garage 的最新动态,获取专为 NVIDIA RTX 硬件优化的最新开源模型与智能体更新。
#ICYMI:RTX AI Garage 最新动态
✨ 在使用 llama.cpp 运行 Qwen 3.6 模型时,NVIDIA RTX PRO GPU 可实现高达 3 倍的 token 生成速度。获取本地 AI 所需的实时响应能力,让智能体能够处理多步骤任务并不断优化自身能力,从而保持工作流无缝衔接。
Google 的 Gemma 4 26B 和 31B 模型现已提供 NVFP4 检查点版本,可在 NVIDIA Blackwell GPU 上实现更快的性能。将 NVFP4 检查点与 Google 全新的 Multi-Token Prediction drafters 结合使用,可在保持同等输出质量的前提下实现最高 3 倍的推理加速,从而使前沿级别的推理能力得以在本地 NVIDIA GPU 上运行。
Mistral Medium 3.5 版本同样于4月发布,新增了对 llama.cpp 和 Ollama 的兼容性更新,使用户能够在 NVIDIA RTX PRO 和 DGX Spark 系统上运行。
🦞 NVIDIA 近期推出了 NVIDIA NemoClaw,这是一个开源技术栈,通过提升安全性和支持本地模型,优化了 NVIDIA 设备上的 OpenClaw 体验。NemoClaw 现已支持适用于 Linux 的 Windows 子系统(WSL2),为微软平台上的爱好者与开发者提供支持。请按照这份分步操作指南,在 DGX Spark 上开始使用 NemoClaw。
在 Facebook、Instagram、TikTok 和 X 上关注 NVIDIA AI PC,并订阅 RTX AI PC 新闻通讯以随时掌握最新动态。
在 LinkedIn 和 X 上关注 NVIDIA Workstation。
请参阅有关软件产品信息的通知。






