AI News HubLIVE
站內改寫4 分鐘閱讀

DeepSeek Flash 顛覆了智慧代理產品的經濟模式

DeepSeek Flash 透過提供廉價、快速、純文本的程式碼生成模型,打破了開發者與大型模型實驗室之間不合理的定價關係。它使得智慧代理的構建者能夠從依賴昂貴的多模態 API 轉向使用開源模型作為編譯器,大幅降低成本並重構了瀏覽器代理的架構。

來源Hacker News AI作者: arjunchint

DeepSeek Flash 的出現正在從根本上改變智慧代理產品的經濟格局。長期以來,開發者與大型模型實驗室之間存在一種對抗關係:開發者支付高昂的 API 費用,而這些利潤卻被實驗室用來補貼自己的應用程式、代理工具和消費者訂閱服務。這意味著,如果你在構建 AI IDE、瀏覽器代理、支援代理或工作流產品,你實際上在資助那些試圖取代你的公司。

這種不合理的交易在智慧代理市場一直存在:使用最好的封閉模型,支付稅款,然後看著同一家實驗室推出與你競爭的產品。DeepSeek Flash 打破了這種格局。它並非因為是最聰明的模型,而是因為它精準地擊中了智慧代理產品長期以來的痛點:廉價、快速、純文本的程式碼生成。

DeepSeek V4 Flash 是開放的、廉價的、具有長上下文能力,並且在程式碼方面足夠強大,使得“捆綁”再次成為護城河。一旦模型能夠將瀏覽器工作編譯為可執行程式碼,推理提供商就開始在託管上展開價格戰,每個非最先進的模型賬單都變得可選。據報道,就連微軟也在考慮將 DeepSeek 用於 Copilot Cowork,因為其代理定價正轉向基於使用量的模式。

兩年來,預設的瀏覽器代理棧一直荒謬地執行著:截圖 -> 大語言模型 -> 點選 -> 截圖 -> 大語言模型 -> 輸入 -> 截圖 -> 大語言模型 -> 重複。這種架構不僅將模型用於判斷,還將其視為執行時環境。這對 API 賬單有利,但對代理產品卻是災難。簡單來說,開發者被榨取了執行時費用,而非智慧費用。大型實驗室可以向外部構建者收取每輪代理迴圈的溢價 API 費用,同時補貼自己的第一方代理體驗。如果你的代理需要 80 次模型呼叫來完成一個工作流,那不是定價模型的缺陷,而是商業模式本身。

DeepSeek 推翻了這種模式。一旦一個廉價的文本/程式碼模型能夠一次性寫出計劃,並且瀏覽器捆綁能夠本地執行該計劃,前沿 API 的護城河就大大縮小了。模型不必成為工人,它可以成為編譯器。這正是我們新架構 Retriever 背後的真正解鎖:DOM + 工具 + 意圖 -> DeepSeek Flash -> JavaScript 計劃 -> rtrvr.* 捆綁 -> 瀏覽器操作。

程式碼即計劃改變了一切。一個原本需要 40 到 100 次模型呼叫的工作流,現在可以變成一次規劃呼叫、幾次有針對性的語義提取,以及普通的 JavaScript 以機器速度執行枯燥的工作。對於 Retriever 來說,將熱路徑切換到 DeepSeek Flash 帶來了超過 100 倍的成本降低,同時保持了所需的實際瀏覽器代理效能。

這不僅僅是更便宜的模型替換,而是每個代理捆綁構建者的新談判地位。我們做出了五個架構上的賭注:文本優於截圖,程式碼優於工具呼叫記錄,捆綁即產品,經過身份驗證的瀏覽器即執行時,截圖作為後備而非稅款。DeepSeek Flash 使這種架構變得足夠廉價,成為預設路徑。

我對任何構建代理的人的建議是:重寫你的捆綁,使其預設以文本為中心,並透過可執行程式碼呼叫。模型應該根據你的能力生成程式,而不是監控每一次迴圈迭代。舊的瀏覽器代理迴圈是瓶頸。一個普通的瀏覽器代理是這樣工作的: while not done: 觀察頁面 -> 大語言模型生成動作 -> 執行工具。這種構建簡單但執行殘酷。以查詢定價頁面為例,工具迴圈代理需要為每個標籤頁支付模型呼叫來提取和追加資料,而程式碼方案則是一次迴圈寫入,本地執行。

DeepSeek 打破了實驗室稅款。代理捆綁不需要在熱路徑中使用昂貴的模型,它們需要一個能夠讀取緊湊狀態、寫出可靠程式碼並迅速退出的模型。這就是為什麼 DeepSeek Flash 如此重要:它改變了預設假設,從“使用最昂貴的多模態模型直到單位經濟受損”轉變為“使用廉價的開放程式碼規劃器,然後讓捆綁執行”。

舊的護城河是:更好的模型 -> 更多工具呼叫成功 -> 溢價 API 定價。新的護城河是:更好的捆綁 -> 更少的模型呼叫 -> 廉價模型變得足夠好。這對大型實驗室來說是殘酷的逆轉。如果代理執行時是一項漫長的大語言模型對話,前沿提供商掌握著你的利潤;如果執行時是一個捆綁,模型只編譯計劃,那麼價效比勝出。最好的代理棧開始看起來不像“每一步都租用最大的模型”,而更像“使用能寫出正確程式的最廉價模型”。

DeepSeek Flash 在瀏覽器代理最耗錢的地方削弱了 API 稅款。這就是為什麼開放權重對代理如此重要:一旦模型在捆綁程式碼上足夠好,託管就變成商品最佳化問題。提供商在延遲、批處理、量化、快取行為、地理位置和價格上競爭,代理公司不再受制於實驗室的產品策略。

快取文本是缺失的倍增器。對於純文本瀏覽器代理有一個公平的批評:便宜並不自動意味著快速。但如果你的架構每一步都向模型輸入 30,000 個標記的扁平化 DOM,你可以贏得賬單但失去使用者。文本的真正優勢在於可以被快取、切片和執行。DeepSeek 的快取輸入路徑是隱藏功能:在官方 API 上,V4 Flash 快取命中輸入的價格約為每百萬標記 0.0028 美元。更重要的是,代理捆綁的穩定部分正是那些快取良好的部分。截圖沒有同樣的快取故事,而文本則不同。

“純文本”作為更便宜的提示格式和“純文本”作為執行架構是有區別的。錯誤的文本代理每一步都傳送整個頁面,正確的文本代理傳送足夠的頁面狀態來生成程式碼,快取穩定字首,然後讓程式碼以字串和結構化物件操作 DOM。所以,是的,測量每步延遲,但同時也要測量每成功執行的模型呼叫次數、快取命中率、每步上下文增長和端到端任務時間。程式碼即計劃改善了所有這些指標,因為它首先將迴圈從模型中移除。

100 倍的提升是架構性的。這不是說 DeepSeek 神奇地便宜 100 倍,而是成本曲線因為四個乘數同時移動而改變:成本 = 呼叫次數 * 上下文大小 * 未快取比例 * 模型價格。我們透過將工作流編譯為程式碼減少了呼叫次數,透過使用 DOM/文本而不是截圖減少了上下文大小,透過重用穩定文本字首減少了未快取比例,透過將熱路徑移至 DeepSeek Flash 降低了模型價格。對於舊代理需要 40 到 100 次模型呼叫而新代理只需要一次規劃呼叫加幾次語義提取的任務,端到端推理成本可以下降大約兩個數量級。速度也發生了變化:工具迴圈本質上是序列的,而程式碼可以迭代、過濾、批處理、重試、去重並寫入輸出,無需在每個步驟都向模型請求許可。這比基準測試更重要。一個演示可能花費 80 次模型呼叫來完成一次結賬,但一個產品不能讓使用者在每次同步 500 行資料時都經歷 80 次模型呼叫。