AI News HubLIVE
サイト内リライト2 分で読了

Together AI、ICML 2026で全スタックにわたる最先端研究

Together AIはICML 2026で8本の論文が採択され、エージェントからGPUカーネルまでの全スタックの研究を発表。これらの研究はTogetherプラットフォームに統合され、本番環境ですでに活用されている。

Together AIはICML 2026で計8本の論文が採択され、エージェントからGPUカーネルに至る全スタックの研究を発表した。同社は、最先端のAIは単一レイヤーではなく、スタック全体の協調によって生まれると強調する。これらの研究成果はTogetherプラットフォームに直接統合され、本番環境でのワークロードが次の研究課題を生み出す好循環を形成している。

エージェント層では、DSGymがデータサイエンスエージェントの評価と訓練を統一するフレームワークを提供。10以上のドメインにわたる1,000以上のタスクを共通APIで扱い、新たに90の生物情報学タスクと92のKaggle形式のモデリング競技を追加した。ThunderAgentはワークフローをスケジューラが理解できる第一級オブジェクトとして扱うことで、エージェントのスループットを最大3.6倍向上。TTT-Discoverはテスト時強化学習を活用し、オープンモデルで数学、GPUカーネル、競技アルゴリズム、生物学の4分野において人間専門家を超える発見を達成した。

モデル形成では、RAROが従来の検証器を必要としない対向学習により、詩作や財務分析のような自動評価が困難なタスクで監督微調整の5.9%を大きく上回る25%の勝率を達成。V1はスイス式トーナメント検証器を用いて、計算量を増やすことなく正解率を10%向上させた。

アルゴリズム最適化では、Auroraが投機的復号の学習を非同期強化学習に組み替え、新モデル導入初日から1.5倍、トラフィック変動時にはさらに1.25倍の高速化を実現。システム最適化では、Untied Ulyssesがアテンションメモリを最大87.5%削減し、単一8xH100ノードで500万トークンの長文脈訓練を可能にした。Opportunistic Expert Activationはバッチ認識ルーティングにより、再訓練なしでMoEモデルの復号レイテンシを最大39%低減した。

カーネル層の新規論文はないが、同社はカーネル研究も重要な基盤であると述べている。これらの研究はTogether AIの本番システムですでに活用され、AIの効率と能力の限界を押し広げている。