2026-06-30 08:00 UTC+8站内改写1 分钟阅读更新: 2026-07-01 01:54 UTC+8

Together AI在ICML 2026：涵盖全栈的前沿研究

Together AI在ICML 2026上有八篇论文被接收，覆盖从智能代理到GPU内核的整个堆栈。这些研究已集成到Together平台中，并在生产环境中应用。

Together AI在ICML 2026上大放异彩，共有八篇论文被接收，这些研究覆盖了从顶层智能代理到底层GPU内核的全栈技术。该公司强调，前沿AI并非单一层面的突破，而是整个堆栈协同优化的结果。这些研究成果将直接集成到Together平台中，而生产环境的应用又会反过来指引新的研究方向。

在智能代理层，DSGym提供了一个统一的数据科学代理评估和训练框架，整合了超过10个领域的1000多个任务，并新增了90个生物信息学任务和92个Kaggle风格的建模竞赛。ThunderAgent则通过将工作流作为一级对象调度，实现了1.5到3.6倍的代理吞吐量提升。TTT-Discover采用测试时强化学习，利用开源模型在数学、GPU内核、算法和生物学领域取得了超越人类专家的发现，且成本仅需几百美元。

在模型塑造方面，RARO通过对抗训练替代传统验证器，在无法自动评分的任务上（如诗歌写作）取得了25%的胜率，远超监督微调的5.9%。V1则通过瑞士锦标赛风格的验证器，在不增加计算量的情况下将正确答案率提升了10%。

在算法优化上，Aurora将投机解码的学习过程转化为异步强化学习，使新模型在部署首日即可获得1.5倍加速，并且在流量变化时额外提升1.25倍。该系统持续在线更新，零停机时间。

系统优化层面，Untied Ulysses通过头分块技术将注意力内存降低87.5%，使得在单个8xH100节点上即可实现5M tokens的长上下文训练。机会性专家激活（OEA）则通过批量感知路由恢复了Mixture-of-Experts模型的稀疏性，在不重新训练的情况下将解码延迟降低了39%。

最后是内核层，虽无新论文，但Together AI强调其内核研究同样是整个飞轮的重要组成部分。通过这八篇论文，Together AI展示了从研究到生产的完整闭环，其成果已经在多个维度上推动了AI的效率与能力边界。