AI News HubLIVE
サイト内リライト2 分で読了

Sakana Fugu:複数モデルを指揮する一つのAPI

Sakana AIが、多様なトップモデルを動的にオーケストレーションするマルチエージェントシステム「Fugu」を発表。単一のAPIで複雑なタスクを処理し、ベンダーロックインを回避。ICLR 2026の2本の論文に基づき、エキスパートエージェントの自動編成を学習。Fugu(バランス型)とFugu Ultra(パフォーマンス最適化型)の2モデルを提供。ベンチマークで最高水準の性能を達成し、輸出規制のリスクもなし。EU/EEAでは未提供。

ソースHacker News AI著者: Finbarr

Sakana AIは、複数の最先端モデルを動的にオーケストレーションするマルチエージェントシステム「Sakana Fugu」をリリースしました。Fuguは単一のAPIを通じて、多様な専門モデルを自動的に組み合わせ、複雑なマルチステップタスクを解決します。これにより、ベンダー依存を排除しつつ、フロンティアレベルのパフォーマンスを実現します。

Fuguの核となるのは、タスクに応じてモデルを選択し切り替える学習型コーディネーターです。これにより、APIの複雑さを低減しながら、コストパフォーマンスを向上させます。Fuguには2つのモデルがあります。標準の「Fugu」は性能とレイテンシのバランスに優れ、日常的なワークロードに最適です。一方、「Fugu Ultra」はより広範なエキスパートエージェントプールを調整し、難易度の高い問題で回答品質を最大化します。どちらもOpenAI互換APIで利用可能で、統合を変更せずに切り替えられます。

技術的には、FuguはICLR 2026で発表された2本の論文「TRINITY」と「Conductor」に基づいています。TRINITYは軽量な進化型コーディネーターを使用して、複数のLLMに「思考役」「実行役」「検証役」の役割を割り当てます。Conductorは強化学習により自然言語ベースの協調戦略を発見し、エージェント間のコミュニケーションパターンを設計します。

定量的評価では、FuguモデルはSWE-Bench Pro(73.7%)、TerminalBench 2.1(82.1%)、GPQA-D(95.5%)など、様々なベンチマークで公開フロンティアモデルを上回り、Fable 5やMythos Previewと肩を並べます。さらに、Fuguのエージェントプールには輸出規制の対象となるモデルが含まれていないため、リスクなくフロンティア能力を活用できます。

実際のユースケースとして、AutoResearch実験ではFugu Ultraが単一のH100 GPU上で14時間にわたり123回の実験を自律実行し、小規模GPTのトレーニングレシピを改善。また、古典的な仮名消息の読み順推定やルービックキューブソルバーの生成など、多様なタスクで優れた結果を示しています。

Fuguは柔軟なエージェント選択も可能で、データ、プライバシー、コンプライアンス要件に応じて特定のプロバイダーやモデルを除外できます。現在、EU/EEA地域ではGDPR対応のため利用できません。

Sakana Fuguは、マルチエージェントインテリジェンスをAPIとして提供する新しいアプローチであり、開発者や企業に柔軟で強力、かつコンプライアンスに準拠したAIソリューションをもたらします。