Sakana AI 將 AB-MCTS 商業化,推出企業代理 Sakana Marlin,可生成多達 100 頁的研究報告及幻燈片
東京的 Sakana AI 釋出了其首個商業產品 Sakana Marlin,這是一個面向企業的自主研究代理。每個任務可自主執行長達 8 小時,生成數十至 100 頁的報告和幻燈片。它基於 AB-MCTS(自適應分支蒙特卡洛樹搜尋)和 AI Scientist 工作流程。定價從按次付費(每次執行 100 積分,每積分 98 日元)開始。
總部位於東京的 Sakana AI 本週釋出了其首款商業產品“Sakana Marlin”。該公司將 Marlin 定位為虛擬首席戰略官(Virtual CSO),是一款面向企業的 B2B 自主研究代理。
Marlin 並非像聊天機器人那樣在幾秒內給出回答。使用者提交一個研究主題後,它會自主執行長達約八小時。每次執行返回一份長篇報告以及一套演示幻燈片。Sakana 表示,單次會話會發出數百到數千次 LLM 查詢。
Marlin 是一款企業研究代理,而非聊天助手。使用者給出一個主題或問題後,它會自主規劃假設、瀏覽來源並驗證發現。它可將數週的戰略工作壓縮至數小時。
交付物專為決策者設計。日語公告描述報告為數十頁,英語公告則稱報告可達約 100 頁。在媒體體驗中,報告篇幅為 60–100 頁,引用 60–80 個來源。每份報告包括正文、參考文獻和附錄。演示幻燈片由影像生成 AI 建立。
Sakana 團隊透過 2026 年 4 月的封閉測試對 Marlin 進行了最佳化。約 300 名專業人士在真實任務中測試了該產品,涵蓋戰略制定、市場研究、風險分析和競爭分析。Sakana 還與三菱 UFJ 金融集團合作,並獲得了花旗的戰略投資。
Marlin 的核心是 AB-MCTS(自適應分支蒙特卡洛樹搜尋),源於 Sakana 此前的研究“Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search”。AB-MCTS 將推理視為樹搜尋問題。在每一步,演算法會做出一個決策:它可以“變寬”——生成一個新的候選答案,或者“變深”——完善一個已有前景的答案。標準重複取樣只能並行地“變寬”,然後希望其中一個答案正確。
多 LLM 變體增加了第二個選擇:它可以將步驟路由到完全不同的模型。在 Sakana 報告的 ARC-AGI-2 實驗中,這種協作取得了成效:結合 o4-mini、Gemini 2.5 Pro 和 DeepSeek-R1 解決了約 27.5% 的任務,而單獨使用 o4-mini 解決了約 23%。Marlin 將相同的自適應搜尋應用於長期研究。
第二個關鍵元件是來自 Sakana 的 AI Scientist 專案的工作流自動化。該專案展示了自主科學發現,並發表在《自然》雜誌上。
Marlin 在深度上競爭,而非速度。傳統的深度研究工具在幾分鐘到幾十分鐘內給出答案。Marlin 有意花費數小時以提高輸出質量。例如,OpenAI Deep Research 執行時間為幾分鐘到幾十分鐘,輸出引用文本報告;Perplexity Deep Research 執行幾分鐘,輸出帶引用的文字答案;Google Gemini Deep Research 執行幾分鐘,輸出引用文本報告。而 Marlin 最長約 8 小時,輸出數十至 100 頁的報告加幻燈片。
定價方面,Sakana 提供按次付費以及 Pro、Team 和 Enterprise 層級。按次付費每次執行 100 積分,每積分 98 日元。Pro 每月 15 萬日元,包含 2000 積分。Team 每月 40 萬日元,包含 6000 積分。Enterprise 定價定製,提供專用支援。
Marlin 適用於研究是瓶頸的高風險問題。具體用例包括:市場進入評估(如日本穩定幣和代幣化支付市場)、風險分析(如霍爾木茲海峽封鎖的情景建模)、競爭分析(剖析三家競爭對手並排名定位差距)。每個案例對應一個提示和一次無人值守執行。
使用者無法自行託管 Marlin,但可以執行其核心演算法。Sakana 以 Apache 2.0 許可證開源了 AB-MCTS 作為 TreeQuest。安裝後定義一個生成函式,即可在固定搜尋預算下執行。
優勢包括:經同行評審的基礎(AB-MCTS 在 NeurIPS,AI Scientist 在《自然》);交付物完整(含參考文獻、附錄和幻燈片);自適應計算將資源投入最有前景的分支;核心開源便於研究。弱點包括:長執行時間導致迭代較慢;自動化報告可能包含難以發現的錯誤;定價和設計面向企業而非個人開發者;Marlin 本身閉源,僅開放底層演算法。
關鍵要點:Sakana Marlin 每個任務自主執行約八小時;一次執行產生數十頁報告及幻燈片;基於 AB-MCTS 和 AI Scientist 工作流;入門價格按次付費,每次執行 100 積分(每積分 98 日元);目標使用者為金融、企業戰略、諮詢和智庫團隊。