AI News HubLIVE
站內改寫1 分鐘閱讀

Together AI在ICML 2026:涵蓋全棧的前沿研究

Together AI在ICML 2026上有八篇論文被接收,覆蓋從智慧代理到GPU核心的整個堆疊。這些研究已整合到Together平臺中,並在生產環境中應用。

Together AI在ICML 2026上大放異彩,共有八篇論文被接收,這些研究覆蓋了從頂層智慧代理到底層GPU核心的全棧技術。該公司強調,前沿AI並非單一層面的突破,而是整個堆疊協同最佳化的結果。這些研究成果將直接整合到Together平臺中,而生產環境的應用又會反過來指引新的研究方向。

在智慧代理層,DSGym提供了一個統一的資料科學代理評估和訓練框架,整合了超過10個領域的1000多個任務,並新增了90個生物資訊學任務和92個Kaggle風格的建模競賽。ThunderAgent則透過將工作流作為一級物件排程,實現了1.5到3.6倍的代理吞吐量提升。TTT-Discover採用測試時強化學習,利用開源模型在數學、GPU核心、演算法和生物學領域取得了超越人類專家的發現,且成本僅需幾百美元。

在模型塑造方面,RARO透過對抗訓練替代傳統驗證器,在無法自動評分的任務上(如詩歌寫作)取得了25%的勝率,遠超監督微調的5.9%。V1則透過瑞士錦標賽風格的驗證器,在不增加計算量的情況下將正確答案率提升了10%。

在演算法最佳化上,Aurora將投機解碼的學習過程轉化為非同步強化學習,使新模型在部署首日即可獲得1.5倍加速,並且在流量變化時額外提升1.25倍。該系統持續線上更新,零停機時間。

系統最佳化層面,Untied Ulysses透過頭分塊技術將注意力記憶體降低87.5%,使得在單個8xH100節點上即可實現5M tokens的長上下文訓練。機會性專家啟用(OEA)則透過批次感知路由恢復了Mixture-of-Experts模型的稀疏性,在不重新訓練的情況下將解碼延遲降低了39%。

最後是核心層,雖無新論文,但Together AI強調其核心研究同樣是整個飛輪的重要組成部分。透過這八篇論文,Together AI展示了從研究到生產的完整閉環,其成果已經在多個維度上推動了AI的效率與能力邊界。