Sakana AIがAB-MCTSを製品化、最大100ページの調査レポートを生成するエンタープライズエージェント「Sakana Marlin」を発表
東京に拠点を置くSakana AIは、企業向けの自律型研究エージェント「Sakana Marlin」を初の商用製品として今週出荷した。各タスクは最大8時間自律実行され、数十~100ページのレポートとスライドを生成する。AB-MCTS(適応分岐モンテカルロ木探索)とAI Scientistワークフローを基盤とする。料金は従量制(1実行あたり100クレジット、1クレジット98円)から。
東京に拠点を置くSakana AIは今週、初の商用製品「Sakana Marlin」を出荷した。同社はMarlinを仮想チーフストラテジーオフィサー(Virtual CSO)と位置づけ、企業向けB2B自律研究エージェントとしている。
Marlinはチャットボットのように数秒で回答するものではない。ユーザーが1つの研究トピックを投入すると、最大約8時間自律実行される。各実行は長文レポートとプレゼンテーションスライドデッキを返す。Sakanaによれば、1回のセッションで数百から数千のLLMクエリが発行される。
Marlinはチャットアシスタントではなく、エンタープライズ研究エージェントである。トピックや質問を与えると、仮説の計画、情報源の閲覧、発見の検証を自律的に行う。数週間分の戦略作業を数時間に圧縮する。
成果物は意思決定者向けに構造化されている。日本語の発表では数十ページのレポート、英語の発表では最大約100ページのレポートとされている。報道関係者のハンズオンでは、レポートは60~100ページで、60~80の情報源を引用していた。各レポートには本文、参考文献、付録が含まれる。プレゼンテーションスライドは画像生成AIを用いて生成される。
Sakanaチームは2026年4月のクローズドベータを通じてMarlinを改良した。約300人の専門家が実際のタスクでテストし、戦略策定、市場調査、リスク分析、競合分析などをカバーした。Sakanaはまた、三菱UFJフィナンシャル・グループと提携し、シティグループから戦略的投資を受けている。
Marlinの中核はAB-MCTS(適応分岐モンテカルロ木探索)であり、Sakanaの過去の研究「Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search」に由来する。AB-MCTSは推論を木探索問題として扱う。各ステップでアルゴリズムは1つの決定を行う。「広げる」(新しい候補回答を生成)か「深める」(有望な既存回答を洗練)かを選択できる。標準的な反復サンプリングは並列で広げるだけであり、1つの回答が正しいことを期待する。
マルチLLMバリアントでは、ステップを異なるモデルにルーティングするという第2の選択肢が加わる。Sakanaが報告したARC-AGI-2実験では、o4-mini、Gemini 2.5 Pro、DeepSeek-R1の連携により約27.5%のタスクが解決されたのに対し、o4-mini単独では約23%であった。Marlinは同じ適応探索を長期的な研究に適用する。
第2の重要コンポーネントは、SakanaのAI Scientistプロジェクトによるワークフロー自動化である。このプロジェクトは自律的な科学的発見を実証し、Nature誌に掲載された。
Marlinは速度ではなく深さで競合する。従来のディープリサーチツールは数分から数十分で回答する。Marlinは意図的に時間をかけて出力品質を高める。例えば、OpenAI Deep Researchは数分から数十分で引用付きテキストレポートを出力し、Perplexity Deep Researchは数分で引用付きテキスト回答、Google Gemini Deep Researchは数分で引用付きテキストレポートを出力する。一方Marlinは最大約8時間で数十~100ページのレポートとスライドを出力する。
料金体系は従量制(1実行あたり100クレジット、1クレジット98円)のほか、Pro(月額15万円、2000クレジット)、Team(月額40万円、6000クレジット)、エンタープライズ(カスタム価格、専用サポート)が用意されている。
Marlinは研究がボトルネックとなるハイステークスな質問に適している。具体的なユースケースとしては、市場参入評価(例:規制変更後の日本におけるステーブルコイン・トークン化決済市場の評価)、リスク分析(例:ホルムズ海峡封鎖のシナリオモデリング)、競合分析(例:3社の競合他社をプロファイリングし自社のポジショニングギャップをランク付け)などが挙げられる。各事例は1つのプロンプトと1回の無人実行に対応する。
ユーザーはMarlinをセルフホストできないが、中核アルゴリズムは実行可能である。SakanaはAB-MCTSをTreeQuestとしてApache 2.0ライセンスでオープンソース化した。インストールして生成関数を定義し、固定探索予算で実行できる。
強みとしては、ピアレビューされた基礎(NeurIPSのAB-MCTS、NatureのAI Scientist)、完全な成果物(参考文献、付録、スライド含む)、適応的コンピュート(最も有望なブランチにリソースを集中)、中核のオープンソース化が挙げられる。弱みとしては、実行時間が長く反復が遅い、自動生成レポートに発見しにくいエラーが含まれる可能性、価格設定と設計が企業向けで個人開発者には不向き、Marlin自体はクローズドでアルゴリズムのみオープン、などが挙げられる。
要点:Sakana Marlinは各タスクを最大約8時間自律実行し、数十ページのレポートとスライドを生成する。中核技術はAB-MCTSとAI Scientistワークフロー。従量制は1実行100クレジット(1クレジット98円)から。金融、企業戦略、コンサルティング、シンクタンクのチームをターゲットとする。