元鉴
返回中文阅读流

NVIDIA Newsroom

NVIDIA CEO 黄仁勋在戴尔科技世界大会:‘需求正呈抛物线式飙升,完全是抛物线式’

使用 NVIDIA Vera Rubin NVL72,代理 AI 推理每 token 成本降至十分之一。代理沙箱在 NVIDIA Vera 上比传统 CPU 快 50%,企业数据查询速度提升高达 3 倍。礼来、三星和霍尼韦尔等 5000 家企业已在 Dell AI Factories 运行 AI 工作负载。

中文内容

已翻译professional media英文原文2026-05-18

借助 NVIDIA Vera Rubin NVL72,Agentic AI 推理的每 token 成本降至十分之一。Agent 沙盒在 NVIDIA Vera 上的运行速度比传统 CPU 快 50%,而企业数据查询在 Vera CPU 上的速度最高可提升至 3 倍。Lilly、Samsung 和 Honeywell 等 5,000 家企业正在搭载 NVIDIA 的 Dell AI Factories 上运行 AI 工作负载,将雄心大规模转化为生产力。

这就是 Michael Dell 周一上午在 Dell Technologies World 上描绘的图景。Dell 对其中的利害关系进行了量化:到 2030 年,全球 AI 基础设施支出可能达到 3 万亿至 4 万亿美元,同一时期 token 消耗量预计将增长 3,400%。

“一场大规模的 AI 投资热潮已经展开,一场生产力热潮也正在开始,并且已经出现在一些公司中,包括我们自己的公司,”Dell 说道。“变化的速度已经呈抛物线式上升,而且没有放缓。”

随后,Dell 董事长兼首席执行官请 NVIDIA 创始人兼首席执行官 Jensen Huang 登上主题演讲舞台——在他身后展示的是 NVIDIA 产品组合,从配备 GB10 工作站的桌面式 Dell Pro Max,到搭载 NVIDIA Vera Rubin NVL72 的 Dell PowerRack。

“我们现在已经进入了实用 AI 的时代,这就是需求呈抛物线式增长、完全呈抛物线式增长的原因,”黄仁勋说。“过去需要数月完成的事情,现在只需数周。过去需要数周完成的事情,现在只需数天。而过去需要数天完成的事情,现在只需数小时。这对生产力来说意义重大,但也意味着计算需求的巨大跃升。”

核心信息:企业 AI 已经越过试点阶段,进入智能体 AI 和大规模推理部署阶段。面向下一阶段的平台是 Dell AI Factory with NVIDIA——在企业边界内安全运行前沿模型和自主智能体。

面向智能体时代的新型 AI 工厂

加速计算新闻是此次更新的重点:基于 NVIDIA Vera Rubin NVL72 构建的 Dell PowerEdge XE9812,在超大规模智能体 AI 推理方面,与 NVIDIA Blackwell 相比,可将每 token 成本降低最高达 10 倍。

与之同时推出的还有 PowerEdge XE9880L、XE9885L 和 XE9882L 服务器——这是首批基于 NVIDIA HGX Rubin NVL8 构建的 Dell 系统,支持每机架多达 144 个 GPU,配备 100% 直接液冷计算节点,性能最高可达 HGX B200 的 10 倍。

此外,网络方面推出了新的 Dell PowerSwitch 产品组合,搭载 NVIDIA Quantum-X800 InfiniBand,采用液冷、共封装光学器件,并配备 NVIDIA Spectrum-6 Ethernet。

Dell 还推出了 Dell PowerRack,这是一套完全集成的系统——将计算、网络和存储作为一个整体进行工程设计——其热设计、电源管理和软件优化从一开始就被设计为协同工作。其结果是在企业规模下加速 AI 和高性能计算工作负载,同时无需承担组件组装的集成开销。

在 CPU 方面,Dell PowerEdge M9822 和 R9822 服务器将 NVIDIA Vera CPUs 带入企业 AI 工厂。Vera 专为智能体 AI 而构建,可运行数据管道、分析、沙盒工具和代码工作负载,在这些场景中每一步都要等待上一步完成。

凭借 1.2 TB/s 的内存带宽以及在负载下可预测的性能,Vera 完成智能体工作负载的速度比 x86 处理器快 50%,帮助 PowerEdge 系统通过更快的智能体响应和更短的反馈循环提升 AI 工厂产出。

“Vera CPU 拥有全球所有 CPU 中最高的单线程性能,”Huang 表示。“它的内存带宽是三倍——因此,Starburst、DuckDB 以及所有这些数据库都运行得极其快速,因为智能体会持续高强度访问数据库,所以 CPU 最好要非常快。”

Starburst 是 Dell AI Data Platform with NVIDIA 中的一款新型数据引擎,在 NVIDIA Vera CPU 上可为大规模 SQL 分析提供快 3 倍的查询吞吐量。

企业数据为 AI 工厂提供燃料。Dell 对其 AI Data Platform with NVIDIA 的更新,重点在于基于 NVIDIA CUDA-X 库构建的加速数据引擎——包括用于结构化数据的 cuDF 和用于非结构化数据的 cuVS。

主题演讲中介绍了 Dell AI Factory with NVIDIA 的多位客户。

Lilly 执行副总裁兼首席信息与数字官 Diogo Rau 在主题演讲开场不久登台,讨论了 Lilly 在 AI 驱动下的生命科学进步与创新,这些进步与创新由 Dell 和 NVIDIA 大规模部署的 AI 基础设施提供支持。他将技术描述为大规模交付前沿科学的关键。“我认为,我们也许正处在能够终结我们所认知的疾病的前夜,”Rau 说。“这样的事情在 20 年前完全无法想象,但今天我们可以想象它。”

随后播放了一段来自 Samsung 的视频,重点展示了在 Dell AI Factory with NVIDIA 上运行的研发芯片设计和制造用例。

Honeywell 首席技术官 Suresh Venkatarayalu 与 Michael Dell 一同登台,介绍了该公司从公有云转向本地 AI 的过程——使用 Dell AI Factory 和 Dell AI Data Platform with NVIDIA,支持工业 AI 用例、数字孪生以及从数据中心到边缘的自动化。“对我而言,与 Dell 和 NVIDIA 合作不仅仅是获得基础设施,”Venkatarayalu 说。他解释说,这是完整的 AI 堆栈:可扩展、安全,并受到客户信任。

在金融服务领域,算法交易公司 Hudson River Trading 正在扩展其 Dell 部署,以支持 AI 驱动的研究——运行配备 NVIDIA 加速计算和 NVIDIA Spectrum-X Ethernet 的 Dell PowerEdge XE9685L 服务器,以随着该公司的数据、模型和雄心扩展规模。

本地部署的智能体与模型——安全地

Dell 在主题演讲台上引用了其自身的 AI 采用情况调查。该调查发现,目前 67% 的 AI 工作负载运行在云端之外——包括本地、设备端、边缘或托管设施中——并且 88% 的受访者正在本地运行至少一个 AI 工作负载。

这些本地 AI 公告回应了 Dell 直接向现场提出的一个问题:“如何在你需要的地方部署世界上最好的 AI 模型,并内置安全性和治理能力?”

答案在于 NVIDIA Confidential Computing——它与 Fortanix、Google、Red Hat 及其他合作伙伴共同交付——作为在企业内部安全部署前沿模型的基础,同时不会暴露模型知识产权或数据。

这使企业能够在使用过程中保护 AI 模型和敏感数据,同时获得本地 AI 基础设施在 token 效率、性能和成本方面的优势。

由 Confidential Computing 保护的前沿专有模型

搭载 Gemini 3.0 的 Google Distributed Cloud (GDC) 现已在 Dell PowerEdge XE9780 服务器上提供预览版,由 NVIDIA Blackwell 加速,并由 NVIDIA Confidential Computing 保护——为企业提供用于高级 AI 的私有机密计算环境。

SpaceXAI 还将把最新的 SpaceXAI 模型引入本地部署的 Dell AI Factory,并由 NVIDIA Confidential Computing 端到端保护模型权重和企业数据。

开放前沿模型,在 Dell AI Factory 上原生运行

NVIDIA Nemotron 模型——前沿级开放智能——运行在 Dell AI Factory 基础设施之上,面向希望将开放权重模型调优至自身领域和数据的企业。

Reflection 的开源前沿 AI 模型也将引入本地部署,专为受监管行业、政府和主权实体打造。

更多开放模型——MiniMax-M2.7、DeepSeek Pro、DeepSeek-V4、GLM 5.1 以及经过 NVIDIA NVFP4 优化的 Kimi K2.6——已在 Hugging Face 上的 Dell Enterprise Hub 提供,与 Gemma 4、NVIDIA Nemotron Super 3、Mistral Small 4 和 Arcee Trinity-Large-Thinking 一同上线。

在这个新的智能体时代,企业还需要智能体能够在其数据、系统和工作流已经所在的混合环境和本地部署环境中安全运行。

OpenAI Codex 将与 Dell AI Data Platform 连接,帮助客户让 Codex 更接近使智能体发挥作用的内部上下文:代码库、文档、业务系统、运营知识和团队工作流。Dell 和 OpenAI 还将探索 Codex 如何与 Dell AI Factory 连接。

软件合作伙伴生态系统

Dell 宣布了多项新的软件合作伙伴关系,面向常见的企业 AI 用例,涵盖从 agentic AI 和代码助手到计算机视觉等领域。其中包括 Palantir 与 NVIDIA 于 3 月宣布的主权 AI OS 参考架构,该架构现在可在 Dell 基础设施上运行——用于在本地部署 Palantir Ontology 和 AIP,并与 NVIDIA Sovereign AI OS Reference Architecture 集成。此外,ServiceNow 客户将能够利用 Dell AI Factory,将基础设施与企业工作流自动化结合起来,使组织能够发现、治理并运营以业务成果为重点的 AI。

Dell 还宣布与众多 AI 领导者和软件创新者推出新的解决方案,包括 Fogsphere、Ipsotek、Mistral AI、Poolside 和 Uneeq,并与 CrowdStrike 和 Fortanix 建立安全合作伙伴关系。

从桌面端到数据中心的智能体

最具个人化的消息是:搭载 NVIDIA NemoClaw 堆栈、NVIDIA OpenShell 运行时和 NVIDIA Nemotron 开放模型的 Dell Deskside Agentic AI,可运行在由 NVIDIA Grace Blackwell 架构驱动的 Dell Pro Max with GB10 和 GB300 上,以及由 NVIDIA RTX PRO Blackwell 工作站平台驱动的 Dell Pro Precision 系统上。

定制层:NVIDIA Nemotron、NVIDIA Agent Toolkit 和 NVIDIA NeMoClaw——黄仁勋在台上将这一智能体编排框架描述为本地模型与企业数据之间的连接层——为构建企业自主智能体奠定基础,使组织能够定制模型、编排智能体工作流,并将智能体安全地连接到企业数据和工具。

安全层:NVIDIA OpenShell——一种用于开发和部署自主智能体、具备安全与隐私控制的开源运行时——支持在基础设施层执行企业策略,并已与领先的企业软件平台集成。

NVIDIA OpenShell 现已在整个 Dell AI Factory with NVIDIA 中获得支持,为开发者提供安全的运行时,以便从工作站到服务器构建、部署和治理 AI 智能体。

Dell 还重点介绍了对 NVIDIA AI-Q Blueprint 的支持,为企业提供一个参考示例,用于部署面向深度研究的多智能体工作流——加快从开发到试点再到生产的进程。

第二天

在 Dell Technologies World 的第二天,Dell 首席运营官 Jeff Clarke 和基础设施解决方案集团总裁 Arthur Lewis 将进一步深入介绍 NVIDIA Vera CPU、Vera Rubin、Confidential Computing 和 Nemotron,并现场演示 Dell Deskside Agentic AI。

Huang 和 Dell 周一确定的主题——安全、长时间运行的代理、全栈工厂、安全的本地部署——为 NVIDIA 将在 6 月 1 日至 4 日举行的 COMPUTEX GTC Taipei 上发布的更广泛公告奠定了基础。

原文标题

NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic, Utterly Parabolic’