2026-05-13站内改写

NVIDIA与Ineffable Intelligence携手构建强化学习基础设施的未来

NVIDIA与由AlphaGo架构师David Silver创立的伦敦AI实验室Ineffable Intelligence达成工程级合作，共同开发大规模强化学习基础设施。该合作旨在构建能够支持通过试错学习的AI系统的训练管道，利用NVIDIA Grace Blackwell平台并探索下一代Vera Rubin硬件。强化学习需实时生成数据并持续更新，对互连、内存带宽和服务提出更高要求，有望推动AI超越人类数据，实现通过模拟和经验自主发现新知识。

文章情报

工程师进阶

要点

NVIDIA与Ineffable Intelligence合作，设计大规模强化学习基础设施。
强化学习系统通过试错学习，需实时生成数据并持续更新，对硬件要求更高。
合作从NVIDIA Grace Blackwell开始，并将探索Vera Rubin平台。
该基础设施旨在支持AI通过模拟和经验自主发现新知识。

为什么重要

这条新闻值得关注，因为NVIDIA与Ineffable Intelligence合作，设计大规模强化学习基础设施。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

强化学习智能体——通过试错学习的人工智能系统——能够将计算转化为新知识。这正是NVIDIA与Ineffable Intelligence之间一项新的工程级合作的核心。Ineffable Intelligence是一家总部位于伦敦的AI实验室，由AlphaGo架构师David Silver在Ineffable上周结束保密状态后创立。

NVIDIA创始人兼CEO黄仁勋表示：“AI的下一个前沿是超级学习者——能够从经验中持续学习的系统。我们很高兴能与Ineffable Intelligence合作，共同设计大规模强化学习所需的基础设施，助力他们推动AI前沿，开创新一代智能系统。”

Silver是强化学习的先驱之一，该方法已改变了AI研究。他正致力于将这种方法进一步发展成为一种新范式。Silver说：“研究人员已经基本解决了AI中较容易的问题：如何构建知道人类已知所有知识的系统。但现在我们需要解决AI中更难的问题：如何构建能够自行发现新知识的系统。这需要一种截然不同的方法——从经验中学习的系统。”

这类学习需要一个强大且高度优化的管道来支持。与使用固定人类数据集的预训练不同，强化学习工作负载会实时生成自己的数据。系统必须在紧密循环中持续行动、观察、评分和更新，这对互连、内存带宽和服务提出了预训练所没有的压力。此外，系统将基于与人类语言和其他人类数据截然不同的丰富经验形式进行训练，可能需要新颖的模型架构和训练算法。

这正是NVIDIA和Ineffable的技术工作重点：构建一个能够大规模供给强化学习系统的管道。两家公司的工程师已联手探索创建这一训练管道的最佳方式。这项工作将从NVIDIA Grace Blackwell平台开始，并成为首批探索即将推出的NVIDIA Vera Rubin平台的合作之一。目标是了解随着AI世界超越人类数据，转向通过模拟和经验学习的模型，下一代硬件和软件将需要怎样的发展。

正确构建这一基础设施将解锁前所未有的复杂和丰富环境下的强化学习规模，使智能体能够在所有知识领域发现突破。