元鉴
返回中文阅读流

NVIDIA Developer Blog

为代理框架添加专门的深度研究技能

像 Claude Code、Codex 和 LangChain Deep Agents 这样的代理框架是优秀的编排器。它们管理会话、链接工具、执行代码并响应...

中文内容

已翻译official company source英文原文2026-05-26

Claude Code、Codex 和 LangChain Deep Agents 等智能体框架是出色的编排器。它们管理会话、串联工具、执行代码,并响应开发者意图。但当这些框架需要开展深度研究时,例如多文档综合、由企业数据支持的决策简报,以及带有来源归因的长期分析,深度研究的复杂性就会重新转移到开发者身上。

构建这些智能体的团队必须将其扎根于企业数据,包括连接数据源、路由查询、管理身份验证、调优提示词、评估输出,并保留来源归因。NVIDIA AI-Q 将这项工作打包成一个开源深度研究蓝图,可作为可移植的智能体技能暴露给智能体框架。

借助这项技能,智能体框架可将研究任务委托给本地或托管的 AI-Q 服务器,并接收一份结构化报告作为返回。该框架无需拥有研究流程。敏感源数据可以留在企业环境内部,这在医疗保健、金融服务、政府和国防等受监管行业中至关重要。

什么是 AI-Q 技能?

AI-Q 技能使 Claude Code、Codex 或其他通用智能体能够向正在运行的 AI-Q 服务器提交研究任务,并接收带有引用的、格式规范且详尽的报告。该技能包含一个 SKILL.md 文件,用于告知执行框架如何使用 AI-Q,另有一个辅助脚本用于管理请求路由、作业提交、轮询和结果检索。

在智能体工作流中,技能可以有不同含义。智能体技能用于指导执行框架,NVIDIA NeMo Agent Toolkit 帮助定义可复用的工具函数,而 AI-Q Agent Skill 则将完整的研究流程——包括意图分类、澄清、浅层研究、深度研究和评估——作为一种更高层级的能力对外提供。通过这些能力结合,智能体可以委托研究任务,而无需在每个执行框架内部重新构建检索、规划、综合和引用逻辑。

视频 1. CODEX 智能体将一个多数据源研究任务作为技能委托给 AI-Q

安装 AI-Q 智能体技能

打包后的技能位于 AI-Q GitHub 仓库的 .agents/skills/aiq-research/ 路径下,SKILL.md 位于其根目录。scripts/aiq.py 辅助程序处理路由的 /chat 请求,并为正在运行的 AI-Q 服务器管理异步深度研究任务;默认使用 http://localhost:8000,可通过 AIQ_SERVER_URL 覆盖。

先决条件:

  • Python 3.10 或更高版本
  • 一个正在运行且可由测试工具访问的 AI-Q Blueprint 服务器,可以是本地部署或托管部署

正文:Claude Code

Claude Code 会从 .claude/skills/ 加载仓库本地技能。为确保与 Claude 兼容,请使用以下两个命令将 AI-Q 技能手动链接到工作区:

mkdir -p .claude/skills
ln -s ../../.agents/skills/aiq-research .claude/skills/aiq-research

对于可跨仓库使用的用户级安装:

mkdir -p ~/.claude/skills
cp -R .agents/skills/aiq-research ~/.claude/skills/aiq-research

正文:Codex

将该技能放入测试框架配置的技能目录:

mkdir -p <codex-skills-dir>
cp -R .agents/skills/aiq-research <codex-skills-dir>/aiq-research

正文:OpenCode

OpenCode 从 ~/.config/opencode/skills/ 加载用户技能:

mkdir -p ~/.config/opencode/skills
cp -R .agents/skills/aiq-research ~/.config/opencode/skills/aiq-research

重新启动会话,然后使用以下命令验证:

python3 scripts/aiq.py
# Usage: aiq.py <command> [args]

注意:此技能需要运行中的 AI-Q 服务器。请查看《Getting Started》指南,了解启动服务器的详细说明,包括如何获取用于推理和网页搜索服务的 API 密钥。

安装完成后,代理框架会看到一个单一的深度研究能力。诸如“在我们的内部政策文档中研究 X 的监管环境并生成一份备忘录”之类的短语会通过该技能进行路由,该技能会向 AI-Q 服务器提交任务、轮询完成状态,并返回一份带有引用的结构化报告。

安全 MCP 集成:AI-Q 作为 MCP 客户端

企业场景的另一半是数据访问。AI-Q 的这个新版本增加了对连接到已认证 MCP 服务器作为数据源的一等支持,因此研究流水线可以从代理已在使用的同一企业系统中拉取数据,而无需搭建并行的检索栈。

AI-Q 基于 NeMo Agent Toolkit 构建,因此 MCP 服务器会作为 NeMo Agent Toolkit 函数组接入。本次发布完整记录了三种集成模式:

ScenarioPatternMCP server has no per-user authmcp_client function groupMCP server uses backend / app credentialsmcp_client + mcp_service_accountDownstream API trusts the AIQ user’s bearer tokenCustom AIQ tool using get_auth_token()
表 1. 常见 MCP 服务器身份验证场景与 AI-Q 集成模式的对应关系,其中每个服务器均作为 NeMo Agent Toolkit 函数组连接

未进行身份验证的 MCP 服务器是最简单的情况。将一个 mcp_client 函数组指向服务器 URL,AIQ 就会发现远程工具并将其注册为 NeMo Agent Toolkit 函数:

function_groups:
  mcp_financial_tools:
    _type: mcp_client
    server:
      transport: streamable-http
      url: ${MCP_SERVER_URL:-http://localhost:9901/mcp}

新部署请使用 streamable-http。受保护的 MCP 服务器需要使用它,并且在生产环境身份验证场景中,建议使用它而不是 sse。

服务账户 MCP 认证是 CI、批处理作业以及共享企业数据源的首选模式,在这些场景中,访问权限是在应用程序级别而非按用户进行管控:

function_groups:
  mcp_enterprise_tools:
    _type: mcp_client
    server:
      transport: streamable-http
      url: ${ENTERPRISE_MCP_URL}
      auth_provider: enterprise_service_account

authentication:
  enterprise_service_account:
    _type: mcp_service_account
    client_id: ${SERVICE_ACCOUNT_CLIENT_ID}
    client_secret: ${SERVICE_ACCOUNT_CLIENT_SECRET}
    token_url: ${SERVICE_ACCOUNT_TOKEN_URL}
    scopes:
      - enterprise.read

对于同时需要 OAuth2 服务账户令牌和服务特定委托令牌的 MCP 服务器,service_token 块会在出站调用中添加第二个标头。

当下游 API 或 MCP 网关已经信任 AI-Q 用户的不记名令牌时,转发已登录 AIQ 用户的身份是当前受支持的模式。AI-Q 暴露 aiq_agent.auth.get_auth_token()。请求令牌会在作业提交时被捕获,并在异步 Dask 工作进程中恢复,因此长时间运行的深度研究作业在执行过程中会保留用户的身份上下文。令牌不会在作业中途刷新。计划在下一版本中支持工作进程内刷新。在此之前,运行时间超过访问令牌 TTL 的作业将在需要认证的工具调用时失败。

部署在你的数据所在位置的研究员

当 AI-Q 与企业数据运行在同一环境中时,这种集成最为强大。AI-Q Blueprint 包含 Docker Compose 和 Helm charts,这意味着完全相同的蓝图可以在开发者笔记本电脑、本地或基于云的 Kubernetes 集群,甚至是气隙隔离的数据中心中运行。

对于受监管行业而言,三项部署属性最为重要:

  • 管道在数据所在的位置运行。AI-Q 可以读取企业数据,执行检索和综合,并生成报告,而无需让原始文档离开受控环境。对于有数据主权要求的企业来说,这一点至关重要。随后,代理框架接收带有引用的输出,而不是直接访问底层来源。
  • 开放模型可以自托管,而不仅仅是管道可以自托管。NVIDIA Nemotron 开放模型可以作为 NVIDIA NIM 在本地运行,而基于云的前沿模型仍然是一个完全可配置的替代方案。这使团队能够构建灵活的工作流:使用前沿模型进行复杂的编排和规划,将敏感研究任务路由到自托管模型,或完全禁用前沿模型以满足严格的合规需求。
  • 可审计性内置于流程之中,而不是事后附加。AI-Q 报告包含来源归因,NeMo Agent Toolkit 会生成 OpenTelemetry 跟踪。合规团队可以检查检索了哪些来源、这些来源如何被使用,以及最终带引用的答案是如何生成的。

对于受监管团队而言,其实际含义很明确:不应直接访问敏感源数据的智能体框架,仍然可以返回基于这些数据的研究成果。AI-Q 在受治理的环境内处理检索与综合,而 MCP 认证模式则保留现有的访问控制。

为研究而构建的流程,而不是为研究改造而来

智能体框架围绕编排而设计。当智能体在没有专用研究后端的情况下处理研究任务时,通用型智能体或子智能体会改变研究工作流。这适用于查询类任务,但在需要企业级多来源综合、长期规划或引用准确性的任务中,可能产生不一致的结果。

AI-Q 的流程专为研究质量而设计。每个查询都会经过四个阶段:

  • 意图分类器用于确定研究深度。
  • 人在回路的澄清器会在检索开始前消除歧义。
  • 浅层研究器负责处理范围明确、可快速查找的问题。
  • 深度研究器可跨企业数据源处理长期跨度的综合分析。

每个阶段都使用既定基准、FreshQA、Deep Research Bench 和 DeepSearchQA 进行独立调优和评估。

AI-Q 可以采用混合模型方法。Nemotron 推理模型负责规划和综合,而可配置的前沿模型路由器可用于需要额外能力的任务。团队可以选择符合其成本、合规和性能要求的模型路径。

用于基准测试的同一套评估工具随该蓝图一同提供,因此团队可以在自己的数据上衡量质量。报告还包括来源归因,显示检索了哪些来源以及它们如何对最终答案作出贡献。

这使得 AI-Q 成为面向代理框架的专用研究后端,而不是一个试图临时组装研究流程的通用代理。

开始使用

AI-Q 作为开源蓝图提供。团队现在就可以为其代理框架添加可复用的深度研究能力。

开始方式:

  • 启动服务器:前往 AI-Q GitHub 仓库,查看使用 Docker Compose 或 Helm 的快速入门部署说明。
  • 连接你的数据:查看关于添加数据源的官方文档,以安全地连接企业 MCP 服务器。
  • 安装技能:运行本文前面详述的设置命令,将 AI-Q 连接到 Claude Code、Codex 或 OpenCode。

AI-Q 现已在 Dell AI Factory 上通过验证。对于在 Dell 基础设施上运行的团队,由 Dell AI Data Platform 提供支持的 Dell-NVIDIA AI-Q 2.0 Reference Architecture,将上述部署模式打包为一个可用于生产环境的本地多智能体研究工作流——专为金融服务、公共部门和制造业等受监管行业打造。

Like

标签

原文标题

Add a Specialized Deep Research Skill to Agent Harnesses