2026-06-30 08:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-07-01 01:54 UTC+8

Together AI在ICML 2026：涵蓋全棧的前沿研究

Together AI在ICML 2026上有八篇論文被接收，覆蓋從智慧代理到GPU核心的整個堆疊。這些研究已整合到Together平臺中，並在生產環境中應用。

Together AI在ICML 2026上大放異彩，共有八篇論文被接收，這些研究覆蓋了從頂層智慧代理到底層GPU核心的全棧技術。該公司強調，前沿AI並非單一層面的突破，而是整個堆疊協同最佳化的結果。這些研究成果將直接整合到Together平臺中，而生產環境的應用又會反過來指引新的研究方向。

在智慧代理層，DSGym提供了一個統一的資料科學代理評估和訓練框架，整合了超過10個領域的1000多個任務，並新增了90個生物資訊學任務和92個Kaggle風格的建模競賽。ThunderAgent則透過將工作流作為一級物件排程，實現了1.5到3.6倍的代理吞吐量提升。TTT-Discover採用測試時強化學習，利用開源模型在數學、GPU核心、演算法和生物學領域取得了超越人類專家的發現，且成本僅需幾百美元。

在模型塑造方面，RARO透過對抗訓練替代傳統驗證器，在無法自動評分的任務上（如詩歌寫作）取得了25%的勝率，遠超監督微調的5.9%。V1則透過瑞士錦標賽風格的驗證器，在不增加計算量的情況下將正確答案率提升了10%。

在演算法最佳化上，Aurora將投機解碼的學習過程轉化為非同步強化學習，使新模型在部署首日即可獲得1.5倍加速，並且在流量變化時額外提升1.25倍。該系統持續線上更新，零停機時間。

系統最佳化層面，Untied Ulysses透過頭分塊技術將注意力記憶體降低87.5%，使得在單個8xH100節點上即可實現5M tokens的長上下文訓練。機會性專家啟用（OEA）則透過批次感知路由恢復了Mixture-of-Experts模型的稀疏性，在不重新訓練的情況下將解碼延遲降低了39%。

最後是核心層，雖無新論文，但Together AI強調其核心研究同樣是整個飛輪的重要組成部分。透過這八篇論文，Together AI展示了從研究到生產的完整閉環，其成果已經在多個維度上推動了AI的效率與能力邊界。