Together AI在ICML 2026:涵盖全栈的前沿研究
Together AI在ICML 2026上有八篇论文被接收,覆盖从智能代理到GPU内核的整个堆栈。这些研究已集成到Together平台中,并在生产环境中应用。
Together AI在ICML 2026上大放异彩,共有八篇论文被接收,这些研究覆盖了从顶层智能代理到底层GPU内核的全栈技术。该公司强调,前沿AI并非单一层面的突破,而是整个堆栈协同优化的结果。这些研究成果将直接集成到Together平台中,而生产环境的应用又会反过来指引新的研究方向。
在智能代理层,DSGym提供了一个统一的数据科学代理评估和训练框架,整合了超过10个领域的1000多个任务,并新增了90个生物信息学任务和92个Kaggle风格的建模竞赛。ThunderAgent则通过将工作流作为一级对象调度,实现了1.5到3.6倍的代理吞吐量提升。TTT-Discover采用测试时强化学习,利用开源模型在数学、GPU内核、算法和生物学领域取得了超越人类专家的发现,且成本仅需几百美元。
在模型塑造方面,RARO通过对抗训练替代传统验证器,在无法自动评分的任务上(如诗歌写作)取得了25%的胜率,远超监督微调的5.9%。V1则通过瑞士锦标赛风格的验证器,在不增加计算量的情况下将正确答案率提升了10%。
在算法优化上,Aurora将投机解码的学习过程转化为异步强化学习,使新模型在部署首日即可获得1.5倍加速,并且在流量变化时额外提升1.25倍。该系统持续在线更新,零停机时间。
系统优化层面,Untied Ulysses通过头分块技术将注意力内存降低87.5%,使得在单个8xH100节点上即可实现5M tokens的长上下文训练。机会性专家激活(OEA)则通过批量感知路由恢复了Mixture-of-Experts模型的稀疏性,在不重新训练的情况下将解码延迟降低了39%。
最后是内核层,虽无新论文,但Together AI强调其内核研究同样是整个飞轮的重要组成部分。通过这八篇论文,Together AI展示了从研究到生产的完整闭环,其成果已经在多个维度上推动了AI的效率与能力边界。