2026-06-30 08:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-07-01 01:54 UTC+8

Together AI在ICML 2026：涵蓋全棧的前沿研究

Together AI在ICML 2026上有八篇論文被接收，覆蓋從智能代理到GPU內核的整個堆棧。這些研究已集成到Together平台中，並在生產環境中應用。

Together AI在ICML 2026上大放異彩，共有八篇論文被接收，這些研究覆蓋了從頂層智能代理到底層GPU內核的全棧技術。該公司強調，前沿AI並非單一層面的突破，而是整個堆棧協同優化的結果。這些研究成果將直接集成到Together平台中，而生產環境的應用又會反過來指引新的研究方向。

在智能代理層，DSGym提供了一個統一的數據科學代理評估和訓練框架，整合了超過10個領域的1000多個任務，並新增了90個生物信息學任務和92個Kaggle風格的建模競賽。ThunderAgent則通過將工作流作為一級對象調度，實現了1.5到3.6倍的代理吞吐量提升。TTT-Discover採用測試時強化學習，利用開源模型在數學、GPU內核、算法和生物學領域取得了超越人類專家的發現，且成本僅需幾百美元。

在模型塑造方面，RARO通過對抗訓練替代傳統驗證器，在無法自動評分的任務上（如詩歌寫作）取得了25%的勝率，遠超監督微調的5.9%。V1則通過瑞士錦標賽風格的驗證器，在不增加計算量的情況下將正確答案率提升了10%。

在算法優化上，Aurora將投機解碼的學習過程轉化為異步強化學習，使新模型在部署首日即可獲得1.5倍加速，並且在流量變化時額外提升1.25倍。該系統持續在線更新，零停機時間。

系統優化層面，Untied Ulysses通過頭分塊技術將注意力內存降低87.5%，使得在單個8xH100節點上即可實現5M tokens的長上下文訓練。機會性專家激活（OEA）則通過批量感知路由恢復了Mixture-of-Experts模型的稀疏性，在不重新訓練的情況下將解碼延遲降低了39%。

最後是內核層，雖無新論文，但Together AI強調其內核研究同樣是整個飛輪的重要組成部分。通過這八篇論文，Together AI展示了從研究到生產的完整閉環，其成果已經在多個維度上推動了AI的效率與能力邊界。