2026-05-13站内改写

NVIDIA與Ineffable Intelligence攜手構建強化學習基礎設施的未來

NVIDIA與由AlphaGo架構師David Silver創立的倫敦AI實驗室Ineffable Intelligence達成工程級合作，共同開發大規模強化學習基礎設施。該合作旨在構建能夠支持通過試錯學習的AI系統的訓練管道，利用NVIDIA Grace Blackwell平台並探索下一代Vera Rubin硬件。強化學習需實時生成數據並持續更新，對互連、內存帶寬和服務提出更高要求，有望推動AI超越人類數據，實現通過模擬和經驗自主發現新知識。

文章情報

工程師進階

要點

NVIDIA與Ineffable Intelligence合作，設計大規模強化學習基礎設施。
強化學習系統通過試錯學習，需實時生成數據並持續更新，對硬件要求更高。
合作從NVIDIA Grace Blackwell開始，並將探索Vera Rubin平台。
該基礎設施旨在支持AI通過模擬和經驗自主發現新知識。

為甚麼重要

這條新聞值得關注，因為NVIDIA與Ineffable Intelligence合作，設計大規模強化學習基礎設施。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

強化學習智能體——通過試錯學習的人工智能系統——能夠將計算轉化為新知識。這正是NVIDIA與Ineffable Intelligence之間一項新的工程級合作的核心。Ineffable Intelligence是一家總部位於倫敦的AI實驗室，由AlphaGo架構師David Silver在Ineffable上週結束保密狀態後創立。

NVIDIA創始人兼CEO黃仁勳表示：“AI的下一個前沿是超級學習者——能夠從經驗中持續學習的系統。我們很高興能與Ineffable Intelligence合作，共同設計大規模強化學習所需的基礎設施，助力他們推動AI前沿，開創新一代智能系統。”

Silver是強化學習的先驅之一，該方法已改變了AI研究。他正致力於將這種方法進一步發展成為一種新範式。Silver説：“研究人員已經基本解決了AI中較容易的問題：如何構建知道人類已知所有知識的系統。但現在我們需要解決AI中更難的問題：如何構建能夠自行發現新知識的系統。這需要一種截然不同的方法——從經驗中學習的系統。”

這類學習需要一個強大且高度優化的管道來支持。與使用固定人類數據集的預訓練不同，強化學習工作負載會實時生成自己的數據。系統必須在緊密循環中持續行動、觀察、評分和更新，這對互連、內存帶寬和服務提出了預訓練所沒有的壓力。此外，系統將基於與人類語言和其他人類數據截然不同的豐富經驗形式進行訓練，可能需要新穎的模型架構和訓練算法。

這正是NVIDIA和Ineffable的技術工作重點：構建一個能夠大規模供給強化學習系統的管道。兩家公司的工程師已聯手探索創建這一訓練管道的最佳方式。這項工作將從NVIDIA Grace Blackwell平台開始，併成為首批探索即將推出的NVIDIA Vera Rubin平台的合作之一。目標是瞭解隨着AI世界超越人類數據，轉向通過模擬和經驗學習的模型，下一代硬件和軟件將需要怎樣的發展。

正確構建這一基礎設施將解鎖前所未有的複雜和豐富環境下的強化學習規模，使智能體能夠在所有知識領域發現突破。