2026-06-15站内改写2 分鐘閱讀更新: 2026-06-15

Sakana AI 將 AB-MCTS 商業化，推出企業代理 Sakana Marlin，可生成多達 100 頁的研究報告及幻燈片

東京的 Sakana AI 釋出了其首個商業產品 Sakana Marlin，這是一個面向企業的自主研究代理。每個任務可自主執行長達 8 小時，生成數十至 100 頁的報告和幻燈片。它基於 AB-MCTS（自適應分支蒙特卡洛樹搜尋）和 AI Scientist 工作流程。定價從按次付費（每次執行 100 積分，每積分 98 日元）開始。

來源MarkTechPost作者: Asif Razzaq

總部位於東京的 Sakana AI 本週釋出了其首款商業產品“Sakana Marlin”。該公司將 Marlin 定位為虛擬首席戰略官（Virtual CSO），是一款面向企業的 B2B 自主研究代理。

Marlin 並非像聊天機器人那樣在幾秒內給出回答。使用者提交一個研究主題後，它會自主執行長達約八小時。每次執行返回一份長篇報告以及一套演示幻燈片。Sakana 表示，單次會話會發出數百到數千次 LLM 查詢。

Marlin 是一款企業研究代理，而非聊天助手。使用者給出一個主題或問題後，它會自主規劃假設、瀏覽來源並驗證發現。它可將數週的戰略工作壓縮至數小時。

交付物專為決策者設計。日語公告描述報告為數十頁，英語公告則稱報告可達約 100 頁。在媒體體驗中，報告篇幅為 60–100 頁，引用 60–80 個來源。每份報告包括正文、參考文獻和附錄。演示幻燈片由影像生成 AI 建立。

Sakana 團隊透過 2026 年 4 月的封閉測試對 Marlin 進行了最佳化。約 300 名專業人士在真實任務中測試了該產品，涵蓋戰略制定、市場研究、風險分析和競爭分析。Sakana 還與三菱 UFJ 金融集團合作，並獲得了花旗的戰略投資。

Marlin 的核心是 AB-MCTS（自適應分支蒙特卡洛樹搜尋），源於 Sakana 此前的研究“Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search”。AB-MCTS 將推理視為樹搜尋問題。在每一步，演算法會做出一個決策：它可以“變寬”——生成一個新的候選答案，或者“變深”——完善一個已有前景的答案。標準重複取樣只能並行地“變寬”，然後希望其中一個答案正確。

多 LLM 變體增加了第二個選擇：它可以將步驟路由到完全不同的模型。在 Sakana 報告的 ARC-AGI-2 實驗中，這種協作取得了成效：結合 o4-mini、Gemini 2.5 Pro 和 DeepSeek-R1 解決了約 27.5% 的任務，而單獨使用 o4-mini 解決了約 23%。Marlin 將相同的自適應搜尋應用於長期研究。

第二個關鍵元件是來自 Sakana 的 AI Scientist 專案的工作流自動化。該專案展示了自主科學發現，並發表在《自然》雜誌上。

Marlin 在深度上競爭，而非速度。傳統的深度研究工具在幾分鐘到幾十分鐘內給出答案。Marlin 有意花費數小時以提高輸出質量。例如，OpenAI Deep Research 執行時間為幾分鐘到幾十分鐘，輸出引用文本報告；Perplexity Deep Research 執行幾分鐘，輸出帶引用的文字答案；Google Gemini Deep Research 執行幾分鐘，輸出引用文本報告。而 Marlin 最長約 8 小時，輸出數十至 100 頁的報告加幻燈片。

定價方面，Sakana 提供按次付費以及 Pro、Team 和 Enterprise 層級。按次付費每次執行 100 積分，每積分 98 日元。Pro 每月 15 萬日元，包含 2000 積分。Team 每月 40 萬日元，包含 6000 積分。Enterprise 定價定製，提供專用支援。

Marlin 適用於研究是瓶頸的高風險問題。具體用例包括：市場進入評估（如日本穩定幣和代幣化支付市場）、風險分析（如霍爾木茲海峽封鎖的情景建模）、競爭分析（剖析三家競爭對手並排名定位差距）。每個案例對應一個提示和一次無人值守執行。

使用者無法自行託管 Marlin，但可以執行其核心演算法。Sakana 以 Apache 2.0 許可證開源了 AB-MCTS 作為 TreeQuest。安裝後定義一個生成函式，即可在固定搜尋預算下執行。

優勢包括：經同行評審的基礎（AB-MCTS 在 NeurIPS，AI Scientist 在《自然》）；交付物完整（含參考文獻、附錄和幻燈片）；自適應計算將資源投入最有前景的分支；核心開源便於研究。弱點包括：長執行時間導致迭代較慢；自動化報告可能包含難以發現的錯誤；定價和設計面向企業而非個人開發者；Marlin 本身閉源，僅開放底層演算法。

關鍵要點：Sakana Marlin 每個任務自主執行約八小時；一次執行產生數十頁報告及幻燈片；基於 AB-MCTS 和 AI Scientist 工作流；入門價格按次付費，每次執行 100 積分（每積分 98 日元）；目標使用者為金融、企業戰略、諮詢和智庫團隊。