元鉴
返回中文阅读流
NVIDIA Developer Blog2026-06-11

为 AI 工厂设计可投产的电池储能系统

AI 工厂正在改变数据中心基础设施必须承担的功能。与传统数据中心不同,AI 工厂旨在大规模制造智能。

摘要已翻译official company source英文原文正文翻译排队
正文翻译排队

该来源正文已进入翻译队列,中文正文生成前先展示摘要和原始出处入口。

摘要

AI 工厂正在改变数据中心基础设施必须承担的功能。与传统数据中心不同,AI 工厂旨在大规模制造智能。

AI 工厂正在改变数据中心基础设施必须具备的能力。

与传统数据中心不同,AI 工厂旨在大规模制造智能。它们运行高功率密度的训练和推理工作负载,越来越多地支持智能体模型和推理模型,并且必须在计算需求快速变化的情况下仍能提供可预测的性能。在这种环境中,电力基础设施不再只是后台公用设施。它是生产系统的一部分。

这也是电池储能系统(battery energy storage systems,BESS)正迅速成为 AI 工厂关键基础设施的原因之一。在 AI 工厂平台 NVIDIA DSX 中,BESS 是更广泛的 AI 工厂电力架构的一部分,而不是一个独立的附加组件。随着加速计算园区的扩展,运营商正在发现,电力不再只是容量问题。它还是控制、质量和互联问题。

设计得当的 BESS 可以帮助 AI 工厂更快接入、更可靠地运行,减轻电网和现场发电的压力,并管理由大规模 AI 工作负载造成的快速变化负载曲线。本文将探讨为什么 BESS 正成为 AI 工厂电力架构的关键,以及为生产部署设计和验证这些系统需要哪些条件。

Aerial rendering of a large AI data center campus with a central facility, rows of battery energy storage containers, power conversion equipment, switchgear, transformers, and utility infrastructureAerial rendering of a large AI data center campus with a central facility, rows of battery energy storage containers, power conversion equipment, switchgear, transformers, and utility infrastructure
图 1。启用 BESS 的 AI 工厂将电池储能、电力转换、控制和电网基础设施相结合,以平滑动态 AI 负载并支持灵活互联

BESS 是一种集成系统,将电池单元与电力转换系统(PCS)逆变器、先进遥测和动态控制方案相结合。电池储存能量,但逆变器和控制系统使该系统能够与电网互动,实时塑造电力的吸收、注入和调节方式。BESS 是一种智能、可控的电力资产,而不是被动的能量储库。

设计良好的 BESS 可以缓冲快速负载波动、改善电能质量、支持低电压穿越、与现场发电协调、实现更平滑的电源切换,并向公用事业公司呈现更稳定、对电网更友好的负载曲线。它还可以与多样化的发电和可再生能源资源无缝集成,包括天然气发动机、燃料电池和光伏(PV)太阳能;AI 工厂日益依赖这些资源来实现基荷和碳目标,而 BESS 则在这些电源之间充当共同缓冲。

最后一项能力正变得越来越重要。随着 AI 工厂向数百兆瓦乃至更大规模扩展,电力可用性正成为部署面临的最大制约因素之一。并网周期漫长的主要驱动因素,是新建 AI 工厂带来的总需求激增超过了现有电网容量,而输电裕度、发电排队以及变电站交付周期都受到限制。

这正是 BESS 在并网阶段变得如此有价值的原因。如果经过适当建模、调试,并与公用事业公司和系统运营商的要求相协调,BESS 可以帮助将数据中心转变为更灵活、可控的负荷,并释放受限的电网容量;这也是许多公用事业公司和独立系统运营商(ISO)为能够提供负荷灵活性的站点引入加速并网通道的原因。与此同时,BESS 有助于站点满足不断演进的技术并网要求,例如负荷平滑、穿越能力和电能质量合规。

这重新界定了关于 BESS 的讨论。问题不再只是 AI 工厂设计中是否应纳入电池系统。问题在于如何设计和验证 BESS,使其作为工业规模 AI 电力架构的一部分可靠运行。

为什么 BESS 对 AI 工厂至关重要

传统数据中心的工作负载行为通常更为渐进且多样。AI 工厂则不同。从电网规划的角度来看,它们表现为大型计算负载:功率密度高、变化快速,并且越来越多地与现场发电、UPS 系统和 BESS 相连接。其基础设施针对加速计算进行了优化,在这种环境中,集群可能导致电力需求快速变化,而整体设施规模也在持续攀升。

这些变化影响整个电气链路:公用电网互连、现场发电、开关设备、变压器、电力转换设备以及园区控制系统。在这样的规模下管理快速爬坡和大型集中负载,需要合适的控制和缓冲系统。

BESS 正是为此而设计,并通过多种方式帮助应对这些挑战。

首先,它补充了 AI 负载平滑方面的努力。行业,尤其是 NVIDIA,正在通过 GPU 级和机架级技术积极从源头抑制功率波动,AI 负载也正逐步变得更加可控。BESS 通过作为设施级缓冲或备用来补充这些努力,在剩余瞬态影响到上游系统时吸收或注入电力,从而帮助保护发电机和电网接口,并提升站点整体稳定性。

其次,它支持扰动穿越。履行这一责任需要基础设施能够可靠地穿越扰动,并助力恢复,而不是加剧扰动。

虽然在故障期间通过备用系统保持关键负载供电长期以来一直是标准做法,但如今电网侧的穿越要求要严格得多。BESS 有助于弥合这一差距:它使负载能够在其备用电源上保持稳定,同时使站点满足电网侧的穿越预期。经过适当容量配置和调试的 BESS 可以同时支持这两者,弥合备用电力连续性与电网侧穿越合规之间的差距。

第三,它提高了运行灵活性。AI 工厂可根据站点设计和当地条件,以并网、协调式现场发电或孤岛配置运行。BESS 可在这些模式之间起到桥接作用,支持黑启动,并在站点无法完全依赖电网时参与电压和频率调节。

最后,它加快了电力就绪。没有 BESS 的 AI 工厂可能在获得电力方面面临更长的延迟,因为它们更难以顺畅地接入电力系统。从公用事业公司和电力系统规划者的角度来看,BESS 显著改善了站点的运行表现,有助于将受限的互联时间表转化为可解决的工程问题。

Technical diagram showing a battery energy storage system connected with generators, the electrical grid, and an AI factory, with arrows indicating bidirectional power flow and system coordinationTechnical diagram showing a battery energy storage system connected with generators, the electrical grid, and an AI factory, with arrows indicating bidirectional power flow and system coordination
图 2. AI 工厂的 BESS 设计是一个协调控制问题,通过实时电力管理将电池、发电机、电网和计算负载连接起来

AI 工厂的 BESS 设计不只是电池容量问题

BESS 的设计挑战比按兆瓦时确定电池规模更复杂。

在 AI 工厂中,BESS 应被视为一种与电网交互的控制系统,其中容量配置与控制相辅相成。电池单元、电力转换系统、控制、遥测、建模、故障响应和荷电状态策略都需要进行一体化工程设计。

站点模型还需要表示计算负载本身,而不仅仅是 BESS。这包括 IT 和非 IT 负载行为、爬坡速率、预期最小和最大需求、功率因数、UPS 运行模式、保护设置、重连逻辑、现场发电行为以及 BESS 控制。如果没有这种程度的建模细节,规划人员就无法可靠评估该站点在正常运行、扰动或恢复过程中是会支撑电网还是会给电网带来压力。

这意味着,成功的设计始于正确的性能目标。

一个目标是电源稳定。随着机架级平滑技术持续发展,BESS 应捕捉到达上游系统的残余负载波动,保护发电机免受剧烈波动影响,并帮助维持电网稳定。

另一个目标是电网自适应运行。BESS 必须在多种配置下支持系统运行:并网、与发电机协调以及孤岛运行;并在这些配置之间切换时保持稳定的控制行为。

限流行为是另一个关键设计因素。虽然由于规范和标准的要求,限流是大多数逆变器固有的功能,但在这些限制条件下的具体限值和行为必须作为设计工作的一部分加以定义。运营方需要可预测的有功和无功功率行为、透明的优先级规则,以及事件结束后的稳定恢复。

为实现上述所有目标,快速遥测、实时分析以及能够基于这些数据采取行动的控制架构必须处于设计的核心。遥测是任何动态响应的起点。电压、电流、有功功率、无功功率、频率、荷电状态、告警和限值状态等核心信号需要实时可用,并且在时间上足够紧密对齐,以支持运行操作和事件后诊断。

最后,系统必须在执行所有功能的同时管理能量裕度。AI 工厂可能会要求 BESS 处理瞬态稳定、保持穿越所需的备用容量,并参与需求响应或发电机协调。这些任务可能相互竞争。因此,设计需要明确的优先级以及清晰的策略,以防止荷电状态发生不受控漂移。

验证是设计变得可信的环节

每一项工程主张都需要验证,AI 工厂也不例外。事实上,这些设施所需的投资规模和必须交付的性能指标,使验证的必要性更加充分。

这里的独特之处在于,AI 工厂代表了一类真正全新的基础设施,而现有标准并非为应对这类基础设施而设计。NVIDIA 正在帮助界定针对这一应用的严格验证应当是什么样的,并从作为集成系统的 BESS 开始。

互连标准已经存在,但尚未涵盖 AI 工厂所需的行为:负载平滑、并网与孤岛模式之间的过渡自适应运行,以及与现场发电的协同响应。运营先例也有限;很少有部署运行时间足够长,能够为这些任务建立性能基准。

NVIDIA 正通过其 BESS 自我认证指南来弥补这一空白,为供应商提供一种结构化方式,以证明产品能力符合 AI 工厂特定要求,并为数据中心开发商有信心地采用这些产品提供依据。在 DSX 中,这种认证方法支持一种电力架构,其中 BESS 作为系统级组件被集成,而不是被视为独立的电池资产。

该框架也与新兴的监管和可靠性要求高度一致,这些要求越来越多地要求了解并预测 AI 工厂在大电力系统中的行为。通过聚焦动态稳定性、能量缓冲,以及使站点行为对电网运营商可观测、可预测的遥测与控制架构,自我资质认定预先契合了这些预期。

Flow diagram showing grid requirements, design specifications, and load requirements feeding into a BESS self-qualification process, which produces simulation, hardware-in-the-loop testing, and product qualification outputsFlow diagram showing grid requirements, design specifications, and load requirements feeding into a BESS self-qualification process, which produces simulation, hardware-in-the-loop testing, and product qualification outputs
图 3. BESS 自我资质认定将电网、设计和 AI 负载要求与仿真、硬件在环测试和产品资质认定连接起来。

这些指南提供了一个实用框架,用于验证 BESS 是否能够在并网和孤岛配置下支持 AI 负载缓冲、需求响应和穿越功能。该流程的重点是工程规范,而不是官僚程序。如果声称具备某项能力,就必须有证据支持。该证据应贯穿至调试投运阶段。

对于 AI 工厂,验证应包括竣工模型核验、运行模式功能测试、在可行情况下的满载和空载测试证据、监控与数据采集(SCADA)和遥测点检查、保护与控制设定核验,以及与受影响的公用事业公司、系统运营商和附近发电业主进行协调。

这些证据包括硬件测试数据和基于模型的分析。该指南承认,某些边缘情况无法在每种环境中直接测试,因此合作伙伴应提供电磁暂态模型和小信号相关资料,用于站点级集成研究。同样重要的是,通过设备级认证并不自动保证整个站点的稳定性。集成仍然至关重要。

该认证流程对应的是数据中心设计人员需要解答的实际问题。

  • 系统能否提供准确且完整的遥测数据?
  • 它能否提供足够详细的扰动记录和故障事件数据,用于事后分析和根因审查?
  • 它能否在孤岛运行中调节电压和频率,同时不出现不稳定振荡?
  • 当电力转换系统在有功功率优先、无功功率优先或混合模式下达到电流限制时,会发生什么?
  • 它能否在弱电网条件下保持稳定的同时缓冲类似 AI 的爬坡曲线?
  • 它能否支持故障穿越事件、电源切换、跟随发电机行为以及黑启动?
  • 它能否在平衡多个同时执行的任务时,随时间管理荷电状态?

这些行为决定了 BESS 是否真正能够胜任 AI 工厂任务。

为什么认证流程很重要,但不应成为全部

认证本身并不足够。

认证的价值在于,它为技术透明性、可复现性和可比性建立了共同基线。它为设计方和运营方提供了一种方法,使其能够依据一致的、面向 AI 工厂的特定标准来评估产品。在一个快速发展的市场中,这一点尤为重要,因为 AI 工厂的需求仍在定义之中,产品能力也在持续演进。

认证奠定了基础,并支持设计流程。

真正的目标是构建一种在实际运行条件下表现良好的电力架构。这包括与公用电网的交互、现场发电协调、园区控制集成、保护理念、可制造性、可维护性以及规模化可靠性。NVIDIA 认证框架认识到了这一点,因此其范围从性能测试扩展到业务就绪度、供应链可信度、质量体系和可靠性证据。

这种更广阔的视角很重要,因为 AI 工厂属于工业级部署。一个系统即使满足设备级认证要求,但如果无法按所需规模制造、无法高效维护,或无法以稳健的质量流程提供支持,也尚未准备好用于生产基础设施。

构建下一代 AI 工厂

NVIDIA 将 AI 工厂描述为一种新型基础设施,旨在规模化地产生智能。这一转变提高了对每一个支撑系统的要求,包括电力系统。

在这种环境下,BESS 正在成为 AI 基础设施的一项使能技术,帮助释放受限的电网容量,整合多样化的发电来源,支持穿越要求,并在电力需求变得更加动态时维持稳定性。其结果是,AI 工厂能够更快接入,并在整个运行范围内表现得更加可预测。

成功的团队将是那些在站点电气设计早期就集成 BESS、定义明确的性能目标、用真实证据验证这些目标,并在设施扩展、改变运行模式或为新的 AI 工作负载重新用途化时,使模型、设置和研究保持最新的团队。这也是 BESS 在 DSX 中发挥的作用:作为 AI 工厂电力栈的一个集成组成部分,帮助使大规模 AI 基础设施更可预测、更可控、更易部署。

AI 计算正在快速发展。其背后的电力系统也需要同样快速地进步,而 BESS 是这一演进的核心。

入门指南

阅读这些 BESS 自我资格认证指南。加入 NVIDIA Partner Network,并与您的 NVIDIA Partner Network 经理合作,将您的解决方案集成到面向 AI Factories 的 DSX Blueprint 中

Like

标签