Together AI在ICML 2026:涵蓋全棧的前沿研究
Together AI在ICML 2026上有八篇論文被接收,覆蓋從智能代理到GPU內核的整個堆棧。這些研究已集成到Together平台中,並在生產環境中應用。
Together AI在ICML 2026上大放異彩,共有八篇論文被接收,這些研究覆蓋了從頂層智能代理到底層GPU內核的全棧技術。該公司強調,前沿AI並非單一層面的突破,而是整個堆棧協同優化的結果。這些研究成果將直接集成到Together平台中,而生產環境的應用又會反過來指引新的研究方向。
在智能代理層,DSGym提供了一個統一的數據科學代理評估和訓練框架,整合了超過10個領域的1000多個任務,並新增了90個生物信息學任務和92個Kaggle風格的建模競賽。ThunderAgent則通過將工作流作為一級對象調度,實現了1.5到3.6倍的代理吞吐量提升。TTT-Discover採用測試時強化學習,利用開源模型在數學、GPU內核、算法和生物學領域取得了超越人類專家的發現,且成本僅需幾百美元。
在模型塑造方面,RARO通過對抗訓練替代傳統驗證器,在無法自動評分的任務上(如詩歌寫作)取得了25%的勝率,遠超監督微調的5.9%。V1則通過瑞士錦標賽風格的驗證器,在不增加計算量的情況下將正確答案率提升了10%。
在算法優化上,Aurora將投機解碼的學習過程轉化為異步強化學習,使新模型在部署首日即可獲得1.5倍加速,並且在流量變化時額外提升1.25倍。該系統持續在線更新,零停機時間。
系統優化層面,Untied Ulysses通過頭分塊技術將注意力內存降低87.5%,使得在單個8xH100節點上即可實現5M tokens的長上下文訓練。機會性專家激活(OEA)則通過批量感知路由恢復了Mixture-of-Experts模型的稀疏性,在不重新訓練的情況下將解碼延遲降低了39%。
最後是內核層,雖無新論文,但Together AI強調其內核研究同樣是整個飛輪的重要組成部分。通過這八篇論文,Together AI展示了從研究到生產的完整閉環,其成果已經在多個維度上推動了AI的效率與能力邊界。