2026-05-13站内改写

NVIDIA與Ineffable Intelligence攜手構建強化學習基礎設施的未來

NVIDIA與由AlphaGo架構師David Silver創立的倫敦AI實驗室Ineffable Intelligence達成工程級合作，共同開發大規模強化學習基礎設施。該合作旨在構建能夠支援透過試錯學習的AI系統的訓練管道，利用NVIDIA Grace Blackwell平臺並探索下一代Vera Rubin硬體。強化學習需即時生成資料並持續更新，對互連、記憶體頻寬和服務提出更高要求，有望推動AI超越人類資料，實現透過模擬和經驗自主發現新知識。

文章情報

工程師進階

要點

NVIDIA與Ineffable Intelligence合作，設計大規模強化學習基礎設施。
強化學習系統透過試錯學習，需即時生成資料並持續更新，對硬體要求更高。
合作從NVIDIA Grace Blackwell開始，並將探索Vera Rubin平臺。
該基礎設施旨在支援AI透過模擬和經驗自主發現新知識。

為什麼重要

這條新聞值得關注，因為NVIDIA與Ineffable Intelligence合作，設計大規模強化學習基礎設施。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

強化學習智慧體——透過試錯學習的人工智慧系統——能夠將計算轉化為新知識。這正是NVIDIA與Ineffable Intelligence之間一項新的工程級合作的核心。Ineffable Intelligence是一家總部位於倫敦的AI實驗室，由AlphaGo架構師David Silver在Ineffable上週結束保密狀態後創立。

NVIDIA創始人兼CEO黃仁勳表示：“AI的下一個前沿是超級學習者——能夠從經驗中持續學習的系統。我們很高興能與Ineffable Intelligence合作，共同設計大規模強化學習所需的基礎設施，助力他們推動AI前沿，開創新一代智慧系統。”

Silver是強化學習的先驅之一，該方法已改變了AI研究。他正致力於將這種方法進一步發展成為一種新正規化。Silver說：“研究人員已經基本解決了AI中較容易的問題：如何構建知道人類已知所有知識的系統。但現在我們需要解決AI中更難的問題：如何構建能夠自行發現新知識的系統。這需要一種截然不同的方法——從經驗中學習的系統。”

這類學習需要一個強大且高度最佳化的管道來支援。與使用固定人類資料集的預訓練不同，強化學習工作負載會即時生成自己的資料。系統必須在緊密迴圈中持續行動、觀察、評分和更新，這對互連、記憶體頻寬和服務提出了預訓練所沒有的壓力。此外，系統將基於與人類語言和其他人類資料截然不同的豐富經驗形式進行訓練，可能需要新穎的模型架構和訓練演算法。

這正是NVIDIA和Ineffable的技術工作重點：構建一個能夠大規模供給強化學習系統的管道。兩家公司的工程師已聯手探索建立這一訓練管道的最佳方式。這項工作將從NVIDIA Grace Blackwell平臺開始，併成為首批探索即將推出的NVIDIA Vera Rubin平臺的合作之一。目標是瞭解隨著AI世界超越人類資料，轉向透過模擬和經驗學習的模型，下一代硬體和軟體將需要怎樣的發展。

正確構建這一基礎設施將解鎖前所未有的複雜和豐富環境下的強化學習規模，使智慧體能夠在所有知識領域發現突破。