AI News HubLIVE
サイト内リライト3 分で読了

Sakana Fugu:マルチエージェントシステムをモデルとして

Sakana AI の Fugu は、内部で複数の専門エージェントを調整しながら、外部からは単一モデルのように振る舞うマルチエージェントシステムです。開発者は 1 回の API 呼び出しで、直接回答、専門家への委任、中間検証、最終合成をトリガーでき、マルチエージェントワークフローの複雑さを隠蔽します。

ソースAnalytics Vidhya著者: Harsh Mishra

Sakana AI が提供する Fugu は、マルチエージェントオーケストレーションをモデルレベルの機能としてパッケージ化した商用製品です。外観は通常の言語モデルと変わりませんが、内部では複数の専門エージェントが連携しています。開発者は 1 つの API にプロンプトを送信するだけで、Fugu がエージェントの選択、役割割り当て、調整、検証、最終応答を自動的に処理し、複雑なオーケストレーションを標準的な LLM インターフェースの背後に隠蔽します。これにより、LangGraph、AutoGen、CrewAI などのフレームワークを使って手動でプランナー、コーダー、レビュアー、リサーチャー、スーパーバイザーなどのエージェントを構築する必要がなくなり、プロンプト管理、ルーティング、リトライ、メモリ、状態、監視、障害回復の負担が軽減されます。

「Fugu」という名前は、日本語で「魚」を意味し、魚群が一つの調整されたシステムとして行動するように、複数のエージェントが一つのインターフェースの背後で協調するというコンセプトに由来します。現在のプロダクション AI システムは、単一モデルプロンプティング、ツール拡張 LLM アプリケーション、手動設計のマルチエージェントワークフローの 3 つのパターンに分類されます。単一モデルプロンプティングはシンプルですが複雑なタスクでは失敗しやすく、ツール拡張 LLM は有用性を高めるもののモデルが依然として中心的な推論エンジンとして機能します。マルチエージェントワークフローは専門エージェントにタスクを分割することで信頼性を向上させますが、構築は難しく、エージェントのタスク割り当て、通信、停止条件、中間出力検証、コストとレイテンシの制御、障害回復、コンプライアンス制限など多くのシステム設計上の問題に対処する必要があります。Fugu はマルチエージェントオーケストレーションをモデルレベルの機能に変換することで、このプロセスを簡素化します。

Fugu には Fugu と Fugu Ultra の 2 つのモデルオプションがあります。Fugu は日常的なコーディング、チャット、レビュー、インタラクティブなワークフロー向けで、品質とレイテンシのバランスを重視します。Fugu Ultra は回答品質を最大化するよう最適化されており、より深い専門エージェントプールを調整し、論文再現、Kaggle スタイルのデータサイエンスワークフロー、サイバーセキュリティ分析、文献レビュー、特許調査、深層技術研究、複雑なコードレビューなどの高難度タスクに適しています。Fugu はタスクに基づいて最適なモデルに動的にルーティングでき、ユーザーは特定のエージェントをプールから除外することも可能です。Fugu Ultra は固定のフルエージェントプールを使用し、問題に応じて 1 から 3 つのエージェントにルーティングします。

Fugu の内部アーキテクチャは、モデル API にラップされた管理オーケストレーション層として理解できます。コアコンポーネントには、API ゲートウェイ(OpenAI 互換エンドポイントをサポートし、既存の SDK を再利用可能)、オーケストレーターモデル(タスク処理方法を決定するコアインテリジェンス層)、エージェントプール(コーディング、推論、研究などに特化した基盤モデル)、動的ルーティング(ワークフローをハードコードしない)、委任と通信(複雑なタスクをサブタスクに分割し指示を送信)、検証(困難なタスクでは複数エージェントによる検証)、合成(最終回答を単一のレスポンスとして返却)が含まれます。

価格設定は従量制とサブスクリプションプランの 2 種類です。従量制では、複数のエージェントがアクティブになっても料金は積み上げられず、最も高い階層のモデルに基づく単一レートが適用されます。Fugu Ultra の固定トークン料金は、入力 100 万トークンあたり 5 ドル(コンテキストが 272K を超える場合は 10 ドル)、出力は 100 万トークンあたり 30 ドル(同 45 ドル)、キャッシュ入力は 0.50 ドル(同 1.00 ドル)です。サブスクリプションプランは Standard(月額 20 ドル)、Pro(月額 100 ドル)、Max(月額 200 ドル)の 3 段階で、いずれも Fugu と Fugu Ultra の利用枠が含まれます。

ベンチマークでは、Fugu と Fugu Ultra はコーディング、推論、科学、エージェントタスク、長文脈推論で高いスコアを示していますが、Fugu Ultra が常に Fugu より優れているわけではありません。開発者は自身のワークロードで両方を評価する必要があります。実用的なルーティング戦略として、インタラクティブな作業には Fugu、複雑で価値の高いタスクには Fugu Ultra、レイテンシやコストが重要な場合は Fugu へのフォールバックが推奨されます。Fugu がオーケストレーションの複雑さを隠蔽しているとはいえ、基盤システムは依然として追加の処理を行うため、チームは総トークン数、オーケストレーショントークン、タスクタイプごとのレイテンシ、品質などを監視する必要があります。