元鉴
返回中文阅读流

NVIDIA Developer Blog

NVIDIA Ising 推出 AI 驱动的工作流以构建容错量子系统

NVIDIA Ising 是全球首个用于构建量子处理器的开放 AI 模型系列,首发包含两个模型领域:Ising Calibration 和 Ising...

中文内容

已翻译official company source英文原文2026-05-26

NVIDIA Ising 是全球首个用于构建量子处理器的开放式 AI 模型家族,首发包含两个模型领域:Ising Calibration 和 Ising Decoding。

二者都针对量子计算中的根本挑战——量子比特本质上具有噪声。最先进的量子处理器大约每一千次操作就会出现一次错误。要成为可用于科学和企业问题的实用加速器,错误率必须降至万亿分之一或更低。AI 是大规模弥合这一差距最有前景的途径。

校准是理解每个量子处理器中的噪声并对其进行调优以实现最佳可能性能的过程。校准可以最大限度地减少错误,但由于量子系统中的噪声,必须由经典计算机实时纠正错误,且速度要快于错误累积的速度。这个过程称为量子纠错解码。校准和解码都需要大量计算,并且需要改进的方法来推动进展。Ising 在校准和纠错解码方面提供先进性能,并使用可扩展到数百万量子比特的技术。

NVIDIA Ising 提供开放的基础模型、训练框架,以及用于微调、量化和部署的工作流。预训练模型开箱即用即可提供顶级性能;而且由于一切都是开放的,用户还可以针对自己的硬件和噪声特性进行专门优化,同时将专有 QPU 数据保留在本地。

在本文中,我们将深入介绍 NVIDIA Ising 如何为用户提供起点,以选择基础模型、训练自己的模型、进行微调、量化,并在需要的任何地方部署优化的推理工作流,从而提升 QPU 性能,并提供一条扩展到能够解决实用问题的 Quantum-GPU Supercomputers 的路径。

NVIDIA Ising 系列首发包含两个突破性模型:

  • NVIDIA Ising Calibration:一种用于自动化 QPU 校准任务的视觉语言模型(VLM)模型。
  • NVIDIA Ising Decoding:由两个 3D CNN 模型组成,用于量子纠错期间所需的高要求解码。
视频 1。NVIDIA Ising 加速实用量子计算

正文:NVIDIA Ising Calibration

NVIDIA Ising Calibration 是一种 VLM,能够理解量子计算科学实验输出,以及其与预期趋势的比较。

该 VLM 可用于一种智能体工作流,该工作流会根据测量结果作出响应,并主动校准量子处理器,直到其运行达到所需规格。

Ising-Calibration-1 模型基于由合作伙伴提供的信息所生成的数据进行训练,这些合作伙伴覆盖多种量子比特模态,包括超导量子比特、量子点、离子、中性原子、氦上电子,以及其他专注于校准和控制的领域。

由于缺乏用于评估量子校准模型的标准基准,NVIDIA 与量子领域合作伙伴合作开发了 QCalEval,这是全球首个用于智能体量子计算机校准的基准,包含真实量子计算机输出。

该基准是一项由六部分组成的语义评分测试,用于评估任何模型在相关校准任务中的有效性。QCalEval 衡量模型解读实验结果、分类结果、评估其重要性、评估拟合质量和关键特征,以及生成可执行的下一步建议的能力。了解有关 QCalEval 基准、模型架构和评估结果的更多信息

Ising-Calibration-1 在一系列不同参数规模的先进开放模型和闭源模型上反复取得更优表现。如图 1 所示,Ising Calibration 1 的平均得分比 Gemini 3.1 Pro 高 3.27%,比 Claude Opus 4.6 高 9.68%,比 GPT 5.4 高 14.5%。这款 35B 参数的 VLM 适用于 NVIDIA Grace Blackwell 和 NVIDIA Vera Rubin 等数据中心 GPU,以及 NVIDIA DGX Spark 等消费级显卡。

Quantum calibration evaluation by model performance chart with six performance comparisons and one average showing Gemini 3.1 Pro, Claude Opus 4.6, GPT 5.4, and Ising Calibration 1 (all data).Quantum calibration evaluation by model performance chart with six performance comparisons and one average showing Gemini 3.1 Pro, Claude Opus 4.6, GPT 5.4, and Ising Calibration 1 (all data).
图 1. 在 QCalEval 基准测试中,Ising Calibration 1 开箱即用地超越所有可比的开放模型,推动 AI 和量子计算校准向前发展。

借助 NVIDIA NeMo Agent Toolkit,开发者可以构建与广泛模型集成的智能体,以自动化校准流程。将这种方法与 Ising-Calibration-1 模型结合使用,开发者可以在极少人工监督的情况下有效地自动化校准工作流。

NVIDIA 合作伙伴已展示了这种智能体式工作流在广泛的校准与控制软件栈中的集成,以及通过 Coda、Cursor 或 Claude Code 等流行编码智能体实现的集成。

要了解更多关于如何使用代理部署 Ising-Calibration-1 的信息,请查看 GitHub 上的蓝图。

正文:NVIDIA Ising Decoding

借助 NVIDIA Ising Decoding 训练框架,QPU 构建者、运营商和解码器开发者可以训练小型 3D CNN AI 解码器。可在空间和时间上扩展的实时操作有助于改善延迟和逻辑错误率。这些预解码器通过处理大量局部化的 syndrome 错误,加速并提高解码器准确性。它们还可以扩展到任意代码距离,帮助团队部署量子纠错解码器,使其能够随 QPU 一直扩展到晶格手术。

用户只需定义其噪声模型、旋转表面码的方向以及模型深度(越深越准确)。随后,该训练框架使用 NVIDIA cuQuantum 中的 cuStabilizer 库和 PyTorch 生成合成训练数据,并训练一个 3D CNN,以针对该任务优化解码性能。用户还可以选择更多或更少的层数,从而在运行时间和准确性之间进行权衡。最佳 CNN 模型取决于代码距离、物理错误率、全局解码器有效性以及往返延迟预算。

准确性还是速度:选择合适的基础模型

两个基础模型示例已在 HuggingFace 上提供,分别针对准确性或速度进行了优化。

Ising-Decoder-SurfaceCode-1-Fast 层数较少,感受野为 9,并在大小为 9x9x9 的输入体积上训练(尽管在推理期间可以使用任意输入体积)。该模型约有 912,000 个参数。由于其规模较小,它可以在 GPU 上高效运行,但与更大的模型相比,对逻辑错误率(LER)的改善较小。Fast 预解码器加 PyMatching 在 d=13、p=0.003 时比 PyMatching 快 2.5 倍,准确性高 1.11 倍。

Ising-Decoder-SurfaceCode-1-Accurate 层数更多,感受野为 13,并在大小为 13x13x13 的输入体积上训练。该模型约有 179 万个参数。鉴于其规模更大,与 Fast 解码器相比,它可以纠正更长的错误链,但运行时间更长。只要这种端到端速度处于目标 QPU 所需范围内,LER 的大幅改善可能值得增加的运行时成本。Accurate 预解码器加 PyMatching 在 d=13、p=0.003 时比 PyMatching 快 2.25 倍,准确性比 PyMatching 高 1.53 倍。

图 2 展示了快速模型和准确模型之间的权衡,并与最小权重完美匹配(MWPM)基线进行了比较。它显示了在给定物理错误率和码距的情况下部署预解码器模型的理想区间。例如,当使用 d=13 的数据进行训练时,在 p=0.003、d=31 的情况下,准确模型可使 LER 提升 3 倍。

The trade-off of using either the fast or accurate pre-decoder on NVIDIA DGX GB300 + PyMatching on NVIDIA Grace Neoverse-V2 CPU compared to PyMatching alone, shows the code distance and physical error rate where the pre-decoder outperformsThe trade-off of using either the fast or accurate pre-decoder on NVIDIA DGX GB300 + PyMatching on NVIDIA Grace Neoverse-V2 CPU compared to PyMatching alone, shows the code distance and physical error rate where the pre-decoder outperforms
图 2。在 NVIDIA DGX GB300 上运行的快速和准确预解码器,以及在 NVIDIA Grace Neoverse-V2 CPU 上运行的 PyMatching

这种方法在一系列噪声模型下改善了 LER 和延迟,并支持将 Union Find、相关匹配和机器学习解码器作为全局解码器,从而实现更具可扩展性的量子纠错策略。

我们还开发了一个基于 NVIDIA CUDA-Q QEC、CUDAQ-Realtime 和 NVIDIA NVQLink 的实时 API,旨在提供量子计算所需的低延迟。我们已经证明,对于 Accurate model + PyMatching、GB300、FP16 精度、物理错误率 0.003、104 轮、表面码 d=13 的设置,我们可以实现 2.33 μs/轮,提供 2.25 倍加速,并使 LER 改善 1.53 倍。

我们预计,在使用 13 个 GB300 GPU、FP8 精度、物理错误率为 0.003、1000 轮、Surface code d=13 的情况下,该快速模型可实现 0.11 微秒/轮。该预解码器模型架构旨在加速解码器并提高其准确性,使我们更接近实用的容错量子计算。请在我们的 CUDA-Q QEC 博客文章中阅读更多内容。

进一步了解 NVIDIA Ising Decoder 模型架构,并探索广泛的分析和结果。

开始使用 NVIDIA Ising 开放资源进行构建

NVIDIA Ising 模型家族完全开放。我们提供了权重、训练框架、数据、基准和配方,使其他人能够针对其特定的 QPU 修改、部署、训练和微调自己的模型及变体。

模型权重

Ising Calibration 1 和 Ising Decoder SurfaceCode 1 的完整参数检查点已在 Hugging Face 上提供,其中 Ising Calibration 1 也可通过 NVIDIA NIM 和 NVIDIA Build 获取。NVIDIA Open Model License 使 QPU 构建者和运营者能够灵活地保持数据控制并在任何地方部署。

训练框架

NVIDIA 正在发布一个面向 Ising Decoder SurfaceCode 1 的完整训练框架,使用户能够使用 NVIDIA cuQuantum 库和 NVIDIA cuStabilizer 即时生成合成数据,同时使用 PyTorch 进行训练。该框架使开发者能够生成针对其特定 QPU 噪声特性定制的解码器模型。

部署指南

面向主要推理引擎的即用型指南和示例已提供,每个都包含配置模板、性能调优指导和参考脚本:

  • 实时解码是在 CUDA-Q QEC 中使用 NVIDIA TensorRT,通过 Decoder SurfaceCode 1 和 PyMatching 运行实时预解码的一个示例。
  • 使用 Ising-Decoding、cuStabilizer 和 PyTorch 训练解码器,并对其进行量化。
  • 量子校准代理是一个脚本,用于使用 Ising Calibration 1 和 NVIDIA Nemo Agent Toolkit 部署代理式工作流,以快速设置量子校准实验自动化。

微调和量化方案

探索 NVIDIA Ising 定制化指南,以针对特定领域进行量化或微调(LoRA/SFT),或提升其代理式推理能力(GRPO/DAPO):

  • 将 Ising-Decoder-SurfaceCode-1 量化为 FP8。

开放数据集和 QCalEval 基准

NVIDIA Ising Calibration 1 基于合作伙伴和协作者提供的真实 QPU 数据构建。还发布了一个语义量子校准基准,用于评估模型在该任务上的有效性。

  • 有关 QCalEval 的详细信息可参见这篇研究论文,并提供了在 GitHub 上运行该基准的脚本。
  • 在 HuggingFace 上查看该数据集。

开始使用

NVIDIA Ising 提供以下入门资源:

  • Ising Decoding 训练框架和指南 GitHub,采用 Apache 2.0 许可。
  • Ising Calibration NIM:可在 build.nvidia.com 和 NVIDIA NGC Catalog 获取。
  • Ising Calibration 智能体工作流与 cookbook GitHub 项目,采用 Apache 2.0 许可。
Like

标签

原文标题

NVIDIA Ising Introduces AI-Powered Workflows to Build Fault-Tolerant Quantum Systems