元鉴
返回中文阅读流

NVIDIA Developer Blog

使用 NVIDIA cuOpt Agent Skills 优化供应链决策系统

现代供应链持续面临需求波动、成本不稳定、产能受限和相互依赖决策等压力。

中文内容

已翻译official company source英文原文2026-05-26

现代供应链持续面临需求波动、成本不稳定、产能受限以及相互依赖的决策等压力。传统上,专门的运筹学(OR)团队通过将业务问题转化为数学模型来解决这些问题。这个过程可能需要数周时间,并且往往产生脆弱的解决方案,在条件变化时难以适应。

Agentic AI 正在改变这一范式。通过将 LLM 的推理能力与 GPU 加速求解器的计算能力相结合,AI 智能体可以理解用自然语言表达的业务问题,并在数秒内将其转化为严谨、优化的决策。

这一方法的核心是 agent skills——一种用于以专业知识和工作流扩展智能体的开放格式。Skills 作为一种封装机制,动态加载正确的流程上下文,并提升智能体在特定任务上的性能。

本文概述了 NVIDIA cuOpt agent skills 的核心内容、其重要性,以及它们如何协同工作:通过将自然语言业务问题转换为数学模型,并使用 NVIDIA cuOpt 决策优化求解器进行求解,从而加速一个多周期供应链规划用例。

如何使用 NVIDIA cuOpt agent skills

NVIDIA cuOpt 是一款 GPU 加速的决策优化引擎,可求解线性规划(LP)、混合整数规划(MIP)和路径规划问题,其速度比基于 CPU 的求解器快数个数量级。通过将 cuOpt 作为 agent skill 提供,LLM 可以把繁重的数学计算交给 GPU,同时专注于理解业务问题、收集数据并返回可执行的结果。

以下步骤概述了如何设置和使用 NVIDIA cuOpt 供应链智能体参考工作流;该工作流使用 cuOpt agent skills,通过智能体驱动的工作流执行 GPU 加速的供应链优化。

第 1 步:设置环境

配置一套带有 NVIDIA GPU 的系统,并安装 NVIDIA Container Toolkit,使容器化工作负载能够访问 GPU。可以在自己的基础设施上运行,也可以部署 Brev Launchable,在云端获得预配置的 GPU 环境,其中已安装 NVIDIA CUDA、Docker 和其他前置条件。

然后,安装 cuOpt agent 包及其依赖项。该演示应用已完成容器化,确保可复现性,并简化在开发、预发布和生产环境中的部署。

第 2 步:初始化智能体

该智能体使用 MiniMax M2.5 作为其推理模型。可以使用公开托管的端点,或者为获得最佳性能,在本地部署 NVIDIA NIM。

其余部署流程很直接。由于应用已容器化,一条简单的 Docker Compose 命令即可在各自端口启动 UI 和 Phoenix tracing,你可以在新标签页中打开它们。

源代码包含若干可供智能体使用的 skills。这些 skills 充当定义明确的函数签名,LLM 可以调用它们。每个 skill 都封装一种特定的优化能力(例如生产计划、库存优化或路径优化)及其输入/输出模式。以这种方式注册 skills,使 LLM 能够根据用户意图动态发现并调用它们。

第 3 步:提供供应链数据

向智能体提供优化所需的特定领域数据。对于多周期规划问题,通常包括:

  • 按产品、地区和时间周期划分的需求预测。
  • 各设施的生产能力和单位成本。
  • 库存持有成本和存储上限。
  • 运输成本和交付周期。
  • 服务级别协议或最低生产批量等业务约束。

在生产部署中,这些数据会直接从规划系统中提取。出于演示目的,该参考工作流使用了模拟真实世界结构的虚拟数据集。

第 4 步:调用 agent skills

用自然语言运营目标提示智能体,例如:“生成一个 12 周的生产和库存计划,在满足所有配送中心预测需求的同时最小化总成本。”

在底层,该工作流使用 LangChain Deep Agents 生成一个子智能体层级结构,每个子智能体负责工作流的一部分。编排智能体会对目标进行推理,将其分解为多个步骤并委派任务。一个子智能体可能负责提取并验证输入数据,另一个可能负责构建数学模型,还有一个可能负责调用 cuOpt skill。

当调用 cuOpt skill 时,智能体会向 cuOpt 求解器传递一个结构化载荷,其中包含决策变量、目标函数和约束条件。

第 5 步:获取解决方案并采取行动

cuOpt 利用大规模并行性在 GPU 上执行优化,以比传统 CPU 求解器更快地评估解空间。找到解之后,智能体会接收优化后的决策变量(例如每个周期各产品的生产量、需要持有的库存量或发往何处),并将其转换回人类可读的摘要。这通常包括总成本、产能利用率和约束松弛量等关键指标。

结果是一份可执行计划,决策者可以审查它,通过后续提示进一步优化,或直接推送到下游执行系统。

观看以下教程,了解如何使用 NVIDIA Brev launchable 设置并运行 cuOpt 供应链智能体参考工作流。

视频 1. 使用 NVIDIA cuOpt agent skills 进行端到端供应链决策优化

可扩展的 agentic 架构

cuOpt 供应链智能体参考工作流是一个简化的起点。你可以使用更多 agent skills 和编排模式对其进行扩展,以更好地适配生产级企业工作负载。下方架构图展示了一种可扩展模式,用于围绕核心智能体工作流添加企业级协调、治理、可靠性和稳健性。

An extended architectural pattern around the NVIDIA cuOpt supply chain agent reference workflow, wrapping the core agents with enterprise coordination, governance, and reliability, and extensible through agent skills.An extended architectural pattern around the NVIDIA cuOpt supply chain agent reference workflow, wrapping the core agents with enterprise coordination, governance, and reliability, and extensible through agent skills.
图 1. 使用 NVIDIA cuOpt 供应链智能体参考工作流的扩展模式架构图

数据集和 GitHub 仓库的快速链接

在 GitHub 上开始使用此 cuOpt agent 工作流。按照快速入门指南在本地运行示例,或使用 NVIDIA Brev Launchable 在云端启动一个 GPU 实例,其中包含预加载的 Jupyter Notebook,可引导你部署该示例。

技术前置条件:

  • 在 NVIDIA GPU 上使用 vLLM 部署 Minimax LLM(例如,八块 NVIDIA A100 Tensor Core GPU)。
  • Docker 和 Docker Compose(配合 NVIDIA Container Toolkit)。
  • 来自 build.nvidia.com 的 NVIDIA API 密钥。

开始使用

使用 NVIDIA NeMo Agent Toolkit 部署 NVIDIA cuOpt Agent 参考工作流,并使用内置优化 skills,或创建你自己的 skills。运行结构化查询,将特定领域约束集成到工作流中,并扩展 cuOpt skills,以基准测试指标并优化你自己的特定领域用例。

订阅 NVIDIA 新闻,并在 LinkedIn、X、Discord 和 YouTube 上关注 NVIDIA AI,以获取 NVIDIA cuOpt 的最新信息。

访问 cuOpt 入门页面,获取 Google Colab、NVIDIA API Catalog、GitHub 和 NVIDIA AI Enterprise 相关资源。

在 NVIDIA forum 和 Discord 上与开发者社区互动。

Like

标签

原文标题

Optimize Supply Chain Decision Systems Using NVIDIA cuOpt Agent Skills