AI News HubLIVE
站內改寫4 分鐘閱讀

DeepSeek Flash 顛覆了智能代理產品的經濟模式

DeepSeek Flash 通過提供廉價、快速、純文本的代碼生成模型,打破了開發者與大型模型實驗室之間不合理的定價關係。它使得智能代理的構建者能夠從依賴昂貴的多模態 API 轉向使用開源模型作為編譯器,大幅降低成本並重構了瀏覽器代理的架構。

來源Hacker News AI作者: arjunchint

DeepSeek Flash 的出現正在從根本上改變智能代理產品的經濟格局。長期以來,開發者與大型模型實驗室之間存在一種對抗關係:開發者支付高昂的 API 費用,而這些利潤卻被實驗室用來補貼自己的應用程序、代理工具和消費者訂閲服務。這意味着,如果你在構建 AI IDE、瀏覽器代理、支持代理或工作流產品,你實際上在資助那些試圖取代你的公司。

這種不合理的交易在智能代理市場一直存在:使用最好的封閉模型,支付税款,然後看着同一家實驗室推出與你競爭的產品。DeepSeek Flash 打破了這種格局。它並非因為是最聰明的模型,而是因為它精準地擊中了智能代理產品長期以來的痛點:廉價、快速、純文本的代碼生成。

DeepSeek V4 Flash 是開放的、廉價的、具有長上下文能力,並且在代碼方面足夠強大,使得“捆綁”再次成為護城河。一旦模型能夠將瀏覽器工作編譯為可執行代碼,推理提供商就開始在託管上展開價格戰,每個非最先進的模型賬單都變得可選。據報道,就連微軟也在考慮將 DeepSeek 用於 Copilot Cowork,因為其代理定價正轉向基於使用量的模式。

兩年來,默認的瀏覽器代理棧一直荒謬地運行着:截圖 -> 大語言模型 -> 點擊 -> 截圖 -> 大語言模型 -> 輸入 -> 截圖 -> 大語言模型 -> 重複。這種架構不僅將模型用於判斷,還將其視為運行時環境。這對 API 賬單有利,但對代理產品卻是災難。簡單來説,開發者被榨取了運行時費用,而非智能費用。大型實驗室可以向外部構建者收取每輪代理循環的溢價 API 費用,同時補貼自己的第一方代理體驗。如果你的代理需要 80 次模型調用來完成一個工作流,那不是定價模型的缺陷,而是商業模式本身。

DeepSeek 推翻了這種模式。一旦一個廉價的文本/代碼模型能夠一次性寫出計劃,並且瀏覽器捆綁能夠本地執行該計劃,前沿 API 的護城河就大大縮小了。模型不必成為工人,它可以成為編譯器。這正是我們新架構 Retriever 背後的真正解鎖:DOM + 工具 + 意圖 -> DeepSeek Flash -> JavaScript 計劃 -> rtrvr.* 捆綁 -> 瀏覽器操作。

代碼即計劃改變了一切。一個原本需要 40 到 100 次模型調用的工作流,現在可以變成一次規劃調用、幾次有針對性的語義提取,以及普通的 JavaScript 以機器速度執行枯燥的工作。對於 Retriever 來説,將熱路徑切換到 DeepSeek Flash 帶來了超過 100 倍的成本降低,同時保持了所需的實際瀏覽器代理性能。

這不僅僅是更便宜的模型替換,而是每個代理捆綁構建者的新談判地位。我們做出了五個架構上的賭注:文本優於截圖,代碼優於工具調用記錄,捆綁即產品,經過身份驗證的瀏覽器即運行時,截圖作為後備而非税款。DeepSeek Flash 使這種架構變得足夠廉價,成為默認路徑。

我對任何構建代理的人的建議是:重寫你的捆綁,使其默認以文本為中心,並通過可執行代碼調用。模型應該根據你的能力生成程序,而不是監控每一次循環迭代。舊的瀏覽器代理循環是瓶頸。一個普通的瀏覽器代理是這樣工作的: while not done: 觀察頁面 -> 大語言模型生成動作 -> 執行工具。這種構建簡單但運行殘酷。以查找定價頁面為例,工具循環代理需要為每個標籤頁支付模型調用來提取和追加數據,而代碼方案則是一次循環寫入,本地執行。

DeepSeek 打破了實驗室税款。代理捆綁不需要在熱路徑中使用昂貴的模型,它們需要一個能夠讀取緊湊狀態、寫出可靠代碼並迅速退出的模型。這就是為什麼 DeepSeek Flash 如此重要:它改變了默認假設,從“使用最昂貴的多模態模型直到單位經濟受損”轉變為“使用廉價的開放代碼規劃器,然後讓捆綁執行”。

舊的護城河是:更好的模型 -> 更多工具調用成功 -> 溢價 API 定價。新的護城河是:更好的捆綁 -> 更少的模型調用 -> 廉價模型變得足夠好。這對大型實驗室來説是殘酷的逆轉。如果代理運行時是一項漫長的大語言模型對話,前沿提供商掌握着你的利潤;如果運行時是一個捆綁,模型只編譯計劃,那麼性價比勝出。最好的代理棧開始看起來不像“每一步都租用最大的模型”,而更像“使用能寫出正確程序的最廉價模型”。

DeepSeek Flash 在瀏覽器代理最耗錢的地方削弱了 API 税款。這就是為什麼開放權重對代理如此重要:一旦模型在捆綁代碼上足夠好,託管就變成商品優化問題。提供商在延遲、批處理、量化、緩存行為、地理位置和價格上競爭,代理公司不再受制於實驗室的產品策略。

緩存文本是缺失的倍增器。對於純文本瀏覽器代理有一個公平的批評:便宜並不自動意味着快速。但如果你的架構每一步都向模型輸入 30,000 個標記的扁平化 DOM,你可以贏得賬單但失去用户。文本的真正優勢在於可以被緩存、切片和執行。DeepSeek 的緩存輸入路徑是隱藏功能:在官方 API 上,V4 Flash 緩存命中輸入的價格約為每百萬標記 0.0028 美元。更重要的是,代理捆綁的穩定部分正是那些緩存良好的部分。截圖沒有同樣的緩存故事,而文本則不同。

“純文本”作為更便宜的提示格式和“純文本”作為執行架構是有區別的。錯誤的文本代理每一步都發送整個頁面,正確的文本代理發送足夠的頁面狀態來生成代碼,緩存穩定前綴,然後讓代碼以字符串和結構化對象操作 DOM。所以,是的,測量每步延遲,但同時也要測量每成功運行的模型調用次數、緩存命中率、每步上下文增長和端到端任務時間。代碼即計劃改善了所有這些指標,因為它首先將循環從模型中移除。

100 倍的提升是架構性的。這不是説 DeepSeek 神奇地便宜 100 倍,而是成本曲線因為四個乘數同時移動而改變:成本 = 調用次數 * 上下文大小 * 未緩存比例 * 模型價格。我們通過將工作流編譯為代碼減少了調用次數,通過使用 DOM/文本而不是截圖減少了上下文大小,通過重用穩定文本前綴減少了未緩存比例,通過將熱路徑移至 DeepSeek Flash 降低了模型價格。對於舊代理需要 40 到 100 次模型調用而新代理只需要一次規劃調用加幾次語義提取的任務,端到端推理成本可以下降大約兩個數量級。速度也發生了變化:工具循環本質上是串行的,而代碼可以迭代、過濾、批處理、重試、去重並寫入輸出,無需在每個步驟都向模型請求許可。這比基準測試更重要。一個演示可能花費 80 次模型調用來完成一次結賬,但一個產品不能讓用户在每次同步 500 行數據時都經歷 80 次模型調用。