元鉴
返回中文阅读流

NVIDIA Developer Blog

利用 AI 物理加速清洁、模块化核反应堆设计

开发社会可接受的核反应堆要求它们安全、清洁、高效、经济且可持续。满足这些要求...

中文内容

已翻译official company source英文原文2026-05-26

开发社会可接受的核反应堆要求其安全、清洁、高效、经济且可持续。满足这些要求需要新的方法,这推动了人们对小型模块化反应堆(SMRs)和第四代(Generation IV)设计日益增长的兴趣。

SMRs 旨在通过标准化设计并将建造转移到受控制造环境中来改善项目经济性,而第四代反应堆则通过更好地管理超铀元素并降低废物的放射毒性和寿命,来应对燃料循环中的根本性挑战。两者结合,为实现更安全、更清洁、更可持续的核能提供了一条可信的路线图。

然而,验证新设计面临重大挑战。由于物理实验成本高昂、时间受限且本身复杂,数值模拟是核反应堆设计的基础。然而,这些模拟的高计算成本往往成为设计过程中的主要瓶颈,减缓了创新步伐。

为了解决这一问题,核工程师正在开发数字孪生,以便以远低于全尺寸原型所需的成本和时间,对复杂反应堆系统和燃料循环进行仿真、测试和优化。NVIDIA CUDA-X 库、PhysicsNeMo AI Physics 框架以及 Omniverse 库通过提供 GPU 加速、AI 增强的仿真解决方案,支持实时数字孪生,帮助核工业开发者应对这些挑战。这些能力使工程师能够探索创新设计、严格评估安全性,并加速向更清洁、更高效的核技术转型。

AI 增强的核反应堆仿真与设计

本节概述了一个模块化参考工作流,用于构建利用 AI 替代模型速度优势的核反应堆交互式数字孪生。构建交互式数字孪生需要采用全栈方法,下面的参考工作流在每个阶段都利用了 NVIDIA 加速计算栈的要素。

  • 数据生成:运行高保真反应堆/多物理场仿真(理想情况下采用 GPU 加速)以生成训练数据。
  • 数据预处理:使用 PhysicsNeMo Curator 将几何结构和场数据整理/转换为可供 GPU 训练使用的数据集。
  • 模型训练:使用 PhysicsNeMo 在多块 GPU 上训练替代模型。
  • 推理与部署:通过 API 提供替代模型服务,以便集成到交互式数字孪生中。
  • 下游工作流:在下游设计任务中使用替代模型(例如优化和不确定性量化工作流)。

虽然上述工作流程提供了重要背景,但本指南的其余部分主要聚焦于模型训练阶段,以及对能够预测完整空间场的代理模型的需求,并重点关注反应堆物理。同样的工作流程也可以很容易地适配到核反应堆设计中其他重要领域,例如 CFD 和结构分析。

构建燃料棒栅元的 AI 代理模型

燃料棒栅元(或简称棒栅元)是核反应堆堆芯建模与仿真中采用的基本重复单元(见下方图 1)。

The figure shows reactor decomposition; a full reactor core, a representative fuel assembly and a pin cellThe figure shows reactor decomposition; a full reactor core, a representative fuel assembly and a pin cell
图 1. 完整反应堆堆芯、代表性燃料组件和单个棒栅元

标准棒元胞由燃料芯块(通常为二氧化铀)、提供机械和化学防护的包壳层以及周围的慢化剂组成(见下方图 2)。它提供了一个简化但在物理上具有代表性的模型,用于在后续组件级和全堆芯分析之前解析局部中子输运和通量分布。

The figure shows a parameterized pin cell: a representative pin cell and the key dimensions used to parameterise the modelThe figure shows a parameterized pin cell: a representative pin cell and the key dimensions used to parameterise the model
图 2. 一个典型棒元胞以及用于参数化该模型的关键尺寸

一个典型反应堆堆芯约包含 50,000 根燃料棒,因此以显式棒元胞分辨率进行全堆芯模拟在计算上不可行。因此,反应堆分析依赖多尺度方法,将精细尺度的输运物理量压缩为有效参数(尤其是均匀化截面),这些参数在保持反应率的同时被用于粗网格堆芯模拟器。

在多尺度反应堆分析中,精确的堆芯模拟依赖于均匀化截面 \(\Sigma_{homog}\) 的生成,以在全堆芯模拟器的粗网格单元内保持反应率。这通过通量加权平均来计算:

\(\large \Sigma_{homog} = \frac{\int_{V} \Sigma(\mathbf{r}) \phi(\mathbf{r}) \, dV}{\int_{V} \phi(\mathbf{r}) \, dV} = \frac{\text{总反应率}}{\text{总通量}}\)

其中,\(\Sigma(\mathbf{r})\) 表示空间宏观截面分布,它取决于局部材料组成和中子能谱;\(\phi(\mathbf{r})\) 表示中子通量分布,作为空间加权函数。

标准的体积加权平均是不充分的,因为它忽略了空间自屏蔽——即在高吸收性燃料区域内中子数量密度降低的现象。因此,确定正确的 \(\Sigma_{homog}\) 需要同时了解精确的中子通量场 \(\phi(\mathbf{r})\) 和宏观截面场 \(\Sigma(\mathbf{r})\)。

传统上,获取 \(\phi(\mathbf{r})\) 和 \(\Sigma(\mathbf{r})\) 需要使用高保真 Monte Carlo 方法求解中子输运方程。该过程计算成本高昂,阻碍了深入的设计空间探索。我们通过训练一个替代模型,直接从几何结构和燃料富集度联合预测 \(\phi(\mathbf{r})\) 和 \(\Sigma(\mathbf{r})\),从而绕过代价高昂的输运求解。

我们证明,通过联合预测空间分辨的通量场和截面场,然后根据这些预测场计算均匀化截面,相比将一组标量输入直接映射到均匀化截面的标准回归模型,能够实现显著更高的准确性。这种与物理一致的方法捕捉了重要的空间效应,尤其是自屏蔽效应,从而带来更好的泛化能力。

用于生成数据集以及训练基于特征的基线回归模型和替代模型的所有代码均可在此处获取。

数据集生成:高效采样

为高效构建数据集,我们将加速求解器与智能采样技术相结合。

第一步是对一个具有代表性的燃料棒单元进行参数化(见上方图 2)。我们改变燃料富集度(裂变材料含量的重量百分比)以及关键几何输入:p(燃料棒间距)、r f(燃料棒半径)、r g(间隙半径)和 r c(包壳半径)。输出为中子通量场和空间分辨的吸收截面图。

为尽量减少训练精确替代模型所需的样本数量(计算成本高昂的模拟),我们采用拉丁超立方采样(LHS)。LHS 确保样本在尽量减少冗余的同时,对设计空间提供良好覆盖。通过将高效采样技术与加速求解器相结合,可以在实际可行的时间范围内生成合适的数据集。

下方图 3 展示了次临界和超临界配置中的中子通量场。当反应堆处于次临界状态时,有效增殖因子 k eff——某一代中子数与上一代中子数之比——小于 1,链式反应无法自维持。当反应堆处于超临界状态时,k eff > 1,中子数量增加。通过在广泛但现实的范围内对富集度和几何结构进行采样,数据集自然包含这两种工况,使替代模型能够接触到与次临界和超临界条件相关的通量场。

Figure shows neutron flux for sub and supercritical configurationsFigure shows neutron flux for sub and supercritical configurations
图 3。次临界和超临界配置中的中子通量场

使用 PhysicsNeMo 进行模型训练

NVIDIA PhysicsNeMo 是一个开源 Python 框架,用于构建、训练和微调模拟复杂数值仿真的 AI 代理模型。它专为 AI 物理工作负载而构建,使开发者能够专注于构建特定领域的 AI 增强应用,而不是底层 AI 软件栈。

重要的是,PhysicsNeMo 提供了用于开发代理模型的模型架构和训练流水线,这些代理模型可预测具有空间分辨率的场(例如压力、温度、中子通量),而不仅仅是标量量。

与通用机器学习库不同,PhysicsNeMo 提供模块化、具备物理感知能力的组件——从神经算子和图神经网络,到扩散模型和基于 Transformer 的模型——这些组件旨在使用最先进的架构捕捉复杂、连续的物理现象。通过将这些架构与优化的数据流水线和分布式训练工具相集成,该框架使研究人员和工程师能够在多 GPU 和多节点平台上高效训练高保真代理模型;与从零开始构建自定义解决方案相比,可显著减少开发时间和计算开销。

此外,PhysicsNeMo 与 PyTorch 无缝集成,因此领域专家可以利用熟悉的深度学习工具,同时通过针对计算机辅助工程(CAE)问题定制的能力对其进行扩展。该框架还包含面向不同领域的精选示例和参考流程,涵盖从湍流流体动力学到电磁学等领域,使开发新应用变得容易。

PhysicsNeMo 所提供的可扩展性、可延展性和优化性能相结合,能够开发出在不牺牲保真度的情况下提供近实时预测的替代模型。

训练 Fourier Neural Operators

在本指南中,我们使用 PhysicsNeMo 训练 Fourier Neural Operator(FNO)。FNO 非常适合用于预测中子通量分布,因为通量场在材料区域内表现出相对平滑的空间变化。

FNO 在谱域中学习场到场算子,其中一组截断的低频 Fourier 模式为平滑解提供了紧凑表示,并自然形成全局感受野。这使模型能够捕捉长程空间耦合,相比于深层局部卷积堆栈,显著降低计算开销。

  1. 输入格式:燃料、包壳和慢化剂通过 one-hot 编码表示为三个二值掩码通道。燃料富集度是一个在整个域上广播的标量值,并作为第四个通道附加。见下方 Figure 4:
Figure shows FNO boolean mask representing the fuel, cladding and moderatorFigure shows FNO boolean mask representing the fuel, cladding and moderator
Figure 4. 表示燃料、包壳和慢化剂的布尔掩码

2. 预处理:目标数据(中子通量和宏观吸收截面)在对数空间中进行归一化,以处理较大的动态范围。3. 训练:

  • FNO 的输入是一个 4 通道张量(B, 4, H, W)
  • 每个像素是一个 4D 特征向量:(燃料、包壳、慢化剂、富集度)。
  • 该模型联合预测中子通量场和吸收截面场,并以归一化对数空间中的 2 通道输出张量(B, 2, H, W)形式输出,训练时使用 MSE 与归一化目标进行比较。

4. 推理:输入采用相同的 4 通道表示。模型预测归一化对数空间中的通量场和吸收截面场,随后对其进行反归一化以恢复物理值。见下方图 5:

Figure shows the ground truth data (numerical results) against the FNO predictions. The numerical results contain visible statistical noise (graininess) inherent to Monte Carlo simulations. The FNO output is visibly smoother.Figure shows the ground truth data (numerical results) against the FNO predictions. The numerical results contain visible statistical noise (graininess) inherent to Monte Carlo simulations. The FNO output is visibly smoother.
图 5. 观测与预测的中子通量场对比

基线模型结果

为展示预测完整中子通量场的优势,我们首先建立一个基线:一种基于特征的回归模型——具体而言,是梯度提升回归器。该基线模型根据一组标量描述符,直接预测标量均匀化截面;这些描述符捕捉了棒元的关键几何特征和材料参数(见上文图 2)。使用基线梯度提升回归器模型获得的结果如下文图 6 所示。该基线模型表现出相当好的预测准确性,R2 得分为 0.80。然而,由于输入表示将棒元几何压缩为一小组标量,它无法捕捉定义中子通量以及由此决定均匀化截面的完整空间效应。

Scatter plot of observed vs predicted homogenised cross-section values from the Gradient Boosting Regressor, with a red dashed x=y line marking perfect prediction. Points cluster near the line in the mid-range but show greater deviation atScatter plot of observed vs predicted homogenised cross-section values from the Gradient Boosting Regressor, with a red dashed x=y line marking perfect prediction. Points cluster near the line in the mid-range but show greater deviation at
图 6. 梯度提升回归器:观测与预测的均匀化截面对比。R2 = 0.80

通过采用两步式物理对齐方法,我们可以显著改进基线模型:使用多输出 FNO 联合预测中子通量场和吸收截面场,然后根据这些预测值计算均匀化截面。图 5 展示了一个代表性棒单元的预测通量场。这种物理对齐方法显著提高了预测准确性,R2 得分达到 0.97(见下方图 7)。

Scatter plot of observed vs predicted homogenised cross-section values from the FNO model, with a red dashed x=y line marking perfect prediction. Points follow the line closely across the full range of values, including at lower values wherScatter plot of observed vs predicted homogenised cross-section values from the FNO model, with a red dashed x=y line marking perfect prediction. Points follow the line closely across the full range of values, including at lower values wher
图 7。FNO:观测到的与预测的均匀化截面。R2 = 0.97

这些结果展示了非单射特征表示的一个例子,其中多个不同的棒单元具有相似的标量描述符但输出不同,从而限制了基于特征的回归模型所能学习到的内容。

两步式物理对齐方法保留了区分这些情况所需的信息,并具有更好的泛化能力。在工程和科学领域,有许多问题表明,保留空间信息而不是将其压缩为标量,会带来显著更好的泛化能力。

集成 AI 替代模型

本指南为核工业领域的开发人员和工程师提供了一个实用工作流,用于使用 PhysicsNeMo 构建 AI 替代模型,并将其集成到他们的设计流程中。

我们聚焦于一个相对简单的栅元示例,其中联合预测中子通量场和吸收截面场,然后计算均匀化截面,相比直接从一组标量描述符预测均匀化截面,可获得显著更高的准确性。

一种将标量描述符直接映射到均匀化截面的基于特征的回归模型,会受到非单射特征表示的影响:不同的几何结构可能具有相似的标量摘要,同时产生显著不同的通量分布,从而产生不同的通量加权均匀化值。

相比之下,FNO 学习从几何/材料场到通量场和吸收截面场的算子映射,保留了实际决定通量加权的空间信息。随后根据预测场计算均匀化截面,从而强制执行正确的基于物理的聚合,这显著提高了预测准确性和泛化能力。

更进一步

NVIDIA PhysicsNeMo 显著简化了行业规模代理模型的训练过程,提供了一系列优化的模型架构和实用工具,简化了分布式训练(包括数据并行和域并行)的实现。

通过抽象掉大规模模型训练的细节,PhysicsNeMo 使开发者和工程师能够专注于结果,并通过提供快速代理建模,大幅减少设计探索所需的时间和计算成本。此外,开发者还可以利用 NVIDIA Omniverse 库创建实时数字孪生。

我们希望本指南能够激励领域专家在其设计工作流程中使用 PhysicsNeMo,并将这一方法扩展到核工业中计算需求最高的问题。

入门

如果你是 SciML 开发者或 AI Physics 从业者,PhysicsNeMo 是你工具库中的强大工具,可用于增强并扩展你的 PyTorch 技术栈。你无需从头构建一切,而是可以导入 PhysicsNeMo 模块,以前所未有的速度和简便性开发 AI Physics 代理模型。你可以使用以下资源轻松且循序渐进地开始:

  • 使用 PhysicsNeMo 构建燃料棒元胞代理模型
  • PhysicsNeMo 入门指南
  • PhysicsNeMo 参考示例

Like

标签

原文标题

Accelerate Clean, Modular, Nuclear Reactor Design with AI Physics