元鉴 Yuanjian

中文内容

已翻译professional media英文原文2026-05-13

强化学习智能体——通过试错进行学习的AI系统——能够将计算转化为新知识。

这正是NVIDIA与Ineffable Intelligence全新工程级合作的重点。Ineffable Intelligence是一家位于伦敦的AI实验室，由AlphaGo架构师David Silver创立，该实验室上周刚刚结束隐秘状态正式亮相。

“AI的下一个前沿是超级学习者——能够从经验中持续学习的系统，”NVIDIA创始人兼首席执行官Jensen Huang表示，“我们非常高兴能与Ineffable Intelligence合作，共同设计大规模强化学习的基础设施，助力他们不断拓展AI前沿，并开创新一代智能系统。”

Silver是强化学习的先驱之一，这一方法已彻底改变了人工智能研究。他致力于将这种方法进一步发展为一种新范式。

“研究人员已基本解决了人工智能中较简单的问题：如何构建能够掌握人类已知所有知识的系统，”Silver表示，“但现在我们需要攻克人工智能中更难的问题：如何构建能够自主发现新知识的系统。这需要一种截然不同的方法——即能够从经验中学习的系统。”

此类学习需要强大且高度优化的处理管线来提供支撑。与预训练不同（在预训练中，固定的人类数据集在系统中流转），强化学习工作负载会在运行过程中实时生成数据。

系统必须在紧密循环中持续执行动作、观察、评分与更新，这对互连、内存带宽及推理服务带来了预训练阶段未曾有的压力。此外，系统将基于与人类语言及其他人类数据截然不同的丰富经验形式进行训练，这可能需要全新的模型架构与训练算法。

这正是 NVIDIA 与 Ineffable 技术研发的重点所在：构建一条能够大规模为强化学习系统供给数据的流水线。两家公司的工程师已组建联合团队，共同探索构建该训练流水线的最佳方案。

该项工作将基于 NVIDIA Grace Blackwell 启动，并有望成为首批探索即将推出的 NVIDIA Vera Rubin 平台的项目之一。其目标在于明确下一代所需的软硬件配置，以应对人工智能领域从依赖人类数据向通过仿真与经验进行学习的模型演进趋势。

正确构建这一基础设施，将释放强化学习在高度复杂且丰富环境中前所未有的规模，使智能体得以在所有知识领域取得突破。